CN111427977A - 电子眼数据的处理方法及装置 - Google Patents
电子眼数据的处理方法及装置 Download PDFInfo
- Publication number
- CN111427977A CN111427977A CN201910022800.6A CN201910022800A CN111427977A CN 111427977 A CN111427977 A CN 111427977A CN 201910022800 A CN201910022800 A CN 201910022800A CN 111427977 A CN111427977 A CN 111427977A
- Authority
- CN
- China
- Prior art keywords
- electronic eye
- words
- address
- address element
- proper nouns
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title description 4
- 238000000034 method Methods 0.000 claims abstract description 59
- 238000012545 processing Methods 0.000 claims abstract description 22
- 238000006243 chemical reaction Methods 0.000 claims abstract description 21
- 238000012216 screening Methods 0.000 claims description 29
- 238000001914 filtration Methods 0.000 claims description 10
- 230000011218 segmentation Effects 0.000 claims description 9
- 238000002372 labelling Methods 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 238000004590 computer program Methods 0.000 description 9
- 238000004519 manufacturing process Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Remote Sensing (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种电子眼数据的处理方法及装置,涉及电子地图技术领域,主要目的在于获取能够进行电子地图电子眼数据制作的数据信息,使得电子眼数据的制作不再借助辅助数据资料信息也可以进行。主要技术方案包括:获取电子眼罚单数据;对电子眼罚单数据进行解析得到电子眼类型以及电子眼罚单地址文字描述信息;对电子眼罚单地址文字描述信息进行空间位置转换生成电子眼的空间位置信息。本发明主要用于地图电子眼数据的制作。
Description
技术领域
本发明涉及电子地图技术领域,特别是涉及一种电子眼数据的处理方法及装置。
背景技术
随着电子设备的发展,目前城市的大街小巷布满了电子眼。该电子眼根据用途又分为很多种类型,例如超速抓拍、闯红灯,逆向行驶、抓拍应急车道等等用于拍摄违反交通规则的类型,监控类,交通路况数据采集类等等。不同类型的电子眼会产生对应类型的数据,并传输到对应的服务器,以便后续进行数据的处理和使用。
为了方便用户在出行的时候,准确清楚的得知什么位置设置有什么类型的电子眼,特别是处于什么位置的电子眼可能会拍摄交通罚单,在进行电子地图的制作时,一般需要将现实世界中的电子眼的位置以及电子眼的类型标注在地图上,以便进行实时的提醒出行者。
在电子地图上进行电子眼数据的制作时,该电子眼数据要包括电子眼的类型、电子眼的位置以及电子眼是否处于工作状态等信息。目前,进行电子眼数据的制作时,一般通过采集户外现实世界中的实景图像信息,进而对该实景图像信息进行识别获取,但是,该种方式只能确定存在电子眼以及电子眼的大略位置,但是无法得知该电子眼是否仍然处于工作状态以及电子眼的类型,使得在进行电子地图上电子眼数据的制作时,还需要借助其他辅助资料信息进行,使得电子眼数据的制作比较复杂,效率较低。
发明内容
有鉴于此,本发明提供的一种电子眼数据的处理方法,主要目的在于获取能够进行电子地图电子眼数据制作的数据信息,使得电子眼数据的制作不再借助辅助数据资料信息也可以进行。
为了解决上述问题,本发明主要提供如下技术方案:
第一方面,本发明提供了一种电子眼数据的处理方法,包括:
获取电子眼罚单数据;
对电子眼罚单数据进行解析得到电子眼类型以及电子眼罚单地址文字描述信息;
对电子眼罚单地址文字描述信息进行空间位置转换生成电子眼的空间位置信息。
第二方面,本发明还提供一种电子眼数据的处理装置,包括:
获取单元,用于获取电子眼罚单数据;
解析单元,用于对电子眼罚单数据进行解析得到电子眼类型以及电子眼罚单地址文字描述信息;
位置转换单元,用于对电子眼罚单地址文字描述信息进行空间位置转换生成电子眼的空间位置信息。
第三方面,本发明还提供一种服务器,包括至少一处理器,一存储介质,所述存储介质用于存储所述处理器执行的程序,以及所述处理器执行所述程序过程中所需的数据;
其中,所述程序被处理器执行时实现如上所述电子眼数据的处理方法的步骤。
本发明提供的电子眼数据的处理方法及装置,其通过电子眼罚单数据进行,由于有电子眼罚单产生的地方,就会有电子眼存在,并且确定该电子眼是处于工作状态的电子眼,电子眼罚单中会注明罚单的类型以及罚单的位置,故本发明实施例对电子眼罚单数据进行解析得到电子眼类型以及电子眼罚单地址文字描述信息,并对电子眼罚单地址文字描述信息进行空间位置转换生成电子眼的空间位置信息,这样在地图中制作电子眼数据所需的电子眼的类型以及电子眼的空间位置信息均已获取,使得电子眼数据制作不需要借助第三方数据的辅助也能够完成,在一定程度上降低了地图中电子眼数据制作的复杂性,提高的制作效率。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种电子眼数据的处理方法流程图;
图2示出了本发明实施例提供的一种对电子眼罚单地址进行空间位置转换生成电子眼的空间位置信息的方法流程图;
图3示出了本发明实施例提供的一种基于词性标注从多个专有名词中筛选出地址要素词的方法流程图;
图4示出了本发明实施例提供的另一种基于词性标注从多个专有名词中筛选出地址要素词的方法流程图;
图5示出了本发明实施例提供的一种基于地址要素词进行空间筛选及空间推理得到电子眼的空间位置对应的空间坐标信息的方法流程图;
图6示出了本发明实施例提供的一种电子眼的空间位置对应的空间坐标信息的获取流程示意图;
图7示出了本发明实施例提供的一种电子眼数据的处理装置的组成框图;
图8示出了本发明实施例提供的另一种电子眼数据的处理装置的组成框图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
本发明实施例提供一种电子眼数据的处理方法,如图1所示,包括:
101、获取电子眼罚单数据。
该处需要说明的是,电子眼罚单数据为从第三方获取的数据,该数据可以为图片形式,也可以为文字形式,具体的本发明实施例对此不进行限制。另外,该处所指的第三方可以为交通部门,也可以为其他部门,具体的,本发明实施例对此不进行限制。
102、对电子眼罚单数据进行解析得到电子眼类型以及电子眼罚单地址文字描述信息。
在对电子眼罚单数据进行解析时,会根据所获取的电子眼罚单的类型而进行对应的处理,当为文字形式时,直接进行文字识别获取。当为图片形式时,需要对图片进行识别获取。具体的,关于文字识别以及图片识别的相关描述,可以参考现有技术中的已有算法,本发明实施例此处将不再一一描述。
103、对电子眼罚单地址文字描述信息进行空间位置转换生成电子眼的空间位置信息。
该步骤将对文字描述信息进行识别,并进行空间位置转换,使得文字描述的地址信息转换生成为空间位置信息。
本发明实施例中,是基于电子眼罚单数据进行处理,由于有电子眼罚单产生的地方,就会有电子眼存在,并且确定该电子眼是处于工作状态的电子眼,电子眼罚单中会注明罚单的类型以及罚单的位置,故本发明实施例对电子眼罚单数据进行解析能够得到电子眼类型以及电子眼罚单地址文字描述信息,并对电子眼罚单地址文字描述信息进行空间位置转换生成电子眼的空间位置信息,这样在地图中制作电子眼数据所需的电子眼的类型以及电子眼的空间位置信息均已获取,使得电子眼数据制作不需要借助第三方数据的辅助也能够完成,在一定程度上降低了地图中电子眼数据制作的复杂性,提高的制作效率。
在获取了电子眼罚单地址文字描述信息之后,如何通过空间位置转换生成电子眼的空间位置信息,以下实施例将具体阐述。如图2所示,本发明实施例提供一种对电子眼罚单地址进行空间位置转换生成电子眼的空间位置信息的方法,如图2所示,该方法包括:
201、基于预先构建好的地址词典,对所述电子眼罚单地址文字描述信息进行分词,得到多个专有名词。
本发明实施例中的地址词典为一个地址库,其可以根据经验收集录入,也可以根据训练录入,具体的,本发明实施对此不进行限制。
基于地址词典,通过分词将连续的字序列按照一定的规范重新组合成词序列。例如电子眼罚单地址文字描述信息“玉溪市龙马路与东风北路交叉路口南50米处”,该文字会被拆分成“玉溪市”,“龙马路”,“与”,“东风北路”,“交叉路口”,“南”,“50米”和“处”这些专有名词。
202、从所述多个专有名词中筛选出与地址相关的地址要素词。
从所述多个专有名词中筛选地址要素词时,可以采用但不局限于以下的方法实现,该方法包括:基于地址要素形成规则对所述多个专有名词逐一进行分析,从中筛选出地址要素词;或者根据专有名词的词性标注从所述多个专有名词中筛选出地址要素词。
其中,当基于地址要素形成规则对所述多个专有名词逐一进行分析,从中筛选出地址要素词时,将所述多个专有名词逐一与地址要素构成规则进行比对,若一致,则确定为地址要素词,否则为非地址要素词。
例如,行政区划地址要素的形成规则为xxx市,道路地址要素的形成规则为xxxx路,还有方位词:东、西、南、北,距离地址要素的形成规则为xxxx米/m,或者xxxx千米/km,将多个专有名词分别与各地址要素的形成规则进行匹配,若匹配成功,则确定为地址要素词。例如,从专有名词“玉溪市”,“龙马路”,“与”,“东风北路”,“交叉路口”,“南”,“50米”和“处”这些词中,提取出的地址要素有“玉溪市”,“龙马路”,“东风北路”,“交叉路口”,“南”和“50米”。
另外,该处需要说明的是,在电子地图领域,每个与地址相关的词都有其分类,例如该词为表述行政区划的词,该词为表示道路的词等等,故在识别词时,可以对该词进行标注,方便后续使用。本发明实施例中所述的词性即为词的类型,是属于行政区划词,还是道路词,还是别的类型的词。该处进行标注的词性可以至少分为以下但又不局限于以下的种类,该种类为政区划、道路、道路和道路间的关系、特别兴趣点等等。对于不同词性的确定,可以通过训练获取。在训练的时候,可以使用但不局限于因马尔科夫模型,本发明实施例对此不进行限制。
在对词进行词性标注时,可以进行单一词性标注或者多词性标注;所述单一词性标注为对一种类型的词进行标注,该种类型的词为行政区划;所述多词性标注为对多种类型的词分别区分标注,该多种类型的词分为行政区划、道路、道路和道路间的关系、特别兴趣点。
该处需要说明的是,一条道路加上行政区划能够唯一的确定一条道路,因为城市之间可能存在相同的道路命名,但是一个城市不可能同时存在两个命名相同的道路,所以在行政区划存在的时候,可以唯一的确定一条道路。故在对词性进行标注时,最简单的就是仅对识别出的词区分是行政区划词,还是非行政区划词。另外由于电子眼罚单的地址文字描述信息本身就有规范的地址命名规则,一般是空间位置从大到小,从区域到具体点位。因此,在对该地址文字描述信息进行分词得到多个专有名词时,其就是一个有一定先后顺序的词序列,只要将第一个行政区划词筛选出来,与词序列中的道路词进行组合,便可以唯一的确定一条路。在进行该行政区划词的词性标注时,可以用任意的标注方式,只要能够区分标注了的词和没有标注的词即可,例如,可以使用单一的标注符号,标注有符号的为行政区划词,没有标注符号的为非行政区划词;还可以使用与非标注法,标注1的为行政区划词,标注0的为非行政区划词,在具体实施时,本发明实施例对此不进行限制。
针对单一词性标注的,具体基于所述词性标注从所述多个专有名词中筛选出地址要素词的方法,如图3所示,该方法包括:
301、从所述多个专有名词中选取被标注的词,将所选取的词确定为行政区划词。
302、以确定的词为开始词与其他专有名词进行组合形成新词。
如上所述的,通过分词得到的多个专有名词为具有一定地址命名规则的有先后顺序的词序列,故,在进行组词时,按照从前到后的顺序进行即可。例如,将行政区划词“玉溪市”与第二个词“龙马路”,进行组合,得到“玉溪市龙马路”;若确定该“龙马路”为地址要素词,则将“玉溪市龙马路”与第三个词“与”进行组合,得到“玉溪市龙马路与”。
303、将形成的新词查询地址词库确定该词是否在地址词库中存在;若存在,则执行304;若不存在,则确定与该行政区划词进行组合的专有名词为非地址要素词。
304、确定与该行政区划词进行组合的专有名词为地址要素词,并执行305。
305、确定是否还存在没有查询的专有名词,若有,则执行302;否则,结束地址要素词的提取。
当然,对分词出的专有名词进行词性标注时除了单一标注以外,还可以采用如上所述的多词性标注,该种标注方式,不仅能够确定分词结果中的行政区划词,还可以将其他的词一并标注其所属的类型,方便后续使用。在进行多词性标注时,可以通过定义不同的符号表示不同类型的词性,用以区分不同的词,例如,定义N为行政区划,R为道路,P为特别兴趣点,Y为路与路之间的关系,方位词标注为Z、距离标注为L等等;也可以用阿拉伯数字进行定义,例如1为行政区划,2为道路,3为特别兴趣点,4为路与路之间的关系;也可以是其他的可以区分的标注内容,具体的本发明实施例对此不进行限制。“玉溪市”标注为N,“龙马路”、“东风北路”标注为R,“与”、“交叉路口”标注为Y,“南”标注为Z,“50米”标注为L。
当所述词性标注为多词性标注时,所述基于所述词性标注从所述多个专有名词中筛选出地址要素词可以采用但不局限于以下的方法,如图4所示,该方法包括:
401、从所述多个专有名词中选取有词性标注的词。
如上所述的,当采用多词性标注时,对本发明实施例中的地址可以有如上的标注,从多个专有名词“玉溪市”标注为N,“龙马路”、“东风北路”标注为R,“与”、“交叉路口”标注为Y,“南”标注为Z,“50米”标注为L,“处”中,选取有词性标注的词,“玉溪市”标注为N,“龙马路”、“东风北路”标注为R,“与”、“交叉路口”标注为Y,“南”标注为Z,“50米”标注为L。
402、对词性标注内容进行识别,得到标注词的类型。
在选取了有标注的词之后,逐一对每个词的标注进行识别,得到标注词的类型。例如,对“玉溪市”的标注N进行识别,确定其为行政区划类;对“龙马路”、“东风北路”的标注R进行识别,确定其为道路类。
403、根据标注词的类型将属于地址要素类型的词确定为地址要素词。
根据上面识别的类型,确定专有名词“玉溪市”为行政区划,确定专有名词“龙马路”、“东风北路”为道路信息。
基于上述筛选地址要素词的实现方式,返回图2所示实施例,继续执行:
203、基于所述地址要素词进行空间筛选及空间推理得到电子眼的空间位置对应的空间坐标信息。
基于上面获取的地址要素词的文字描述,进行空间筛选和空间推理,该方法可以采用但不局限于以下的方法,如图5和图6所示,包括:
501、将所述地址要素词逐一与行政区划库进行比对,确定电子眼所在的行政区划位置信息。
在一个国家,其行政区划名字是一定的,而且是唯一的,并且行政区划的空间面积和边界也是唯一的。故从预先设置的行政区划库中查看行政区划是可以唯一的确定出地址要素词所对应行政区划。该行政区划库中存储着预定空间中的行政区划名称。
该处需要说明的是,在进行地址要素提取时,若对行政区划词进行了标注,则在执行本发明实施例的步骤时,可以仅将该行政区划词与行政区划库进行比对,确定该行政区划词是否在该行政区划库中,若不在,则需要进一步确定是否存在书写错误。若没有对行政区划词进行标注,则需要将所有地址要素词逐一的与所述行政区划库进行比对,确定对应的行政区划。
在执行本步骤时,有可能存在查无结果,即不存在行政区划词的可能性,此时则可以通过道路信息唯一的确定具体的位置空间。因为,现实中,不同的城市可能存在相同的道路命名规则,但是,不可能存在命名规则相同,并且道路和道路之间的关系也相同的两条路,例如在玉溪市有龙马路、东风北路,在洛阳市也有龙马路和东风北路,但是,仅有玉溪市的龙马路和东北北路是相交的,故通过道路之间的位置关系也可以唯一的确定一个空间位置。
502、将地址要素词中除行政区划以外的词逐一与预设的道路POI库进行比对,确定所述地址要素词对应的候选道路信息。
本发明实施例中,道路的确定,如果行政区划的确定一样,若有词性标注,就仅将对应道路词性标注的地址要素词查询道路POI库即可,若没有词性标注,就将所有的地址要素词逐一查询道路POI库确定对应的道路信息,具体的本发明实施例在此不再赘述。
503、通过所述电子眼所在的行政区划位置信息对所述候选道路信息进行空间筛选,得到所述电子眼所在的道路位置信息。
如上所述的,不同的城市可能存在相同的道路命名规则,出现相同的道路名称,如,以龙马路为例,该路在上海、北京、玉溪等多个城市都有,但是结合行政区划信息玉溪市,就能唯一的确定该道路是哪条了。相当于通过龙马路到POI库中进行查询,匹配出多个龙马路,在此情况下,通过玉溪市对多个龙马路进行过滤,可以得到唯一的一条道路玉溪市龙马路。东风北路进行与龙马路相同过程的空间筛选,得到玉溪市东风北路。
504、获取所述地址要素中除所述行政区划以及道路信息对应词外的剩余地址要素词。
本发明实施例中获取地址要素词“与”、“交叉路口”,“南”,“50米”。
505、在所述道路位置信息的基础上,利用所述剩余地址要素词对电子眼的空间位置进行空间推理,得到电子眼的空间位置对应的空间坐标信息。
同样如上所述的,获取的地址要素词是具有先后顺序的词,从行政区划开始,将道路词与后面的地址要素词进行空间的计算。如图6所示,玉溪市龙马路与玉溪市东风北路的交叉路口;按照词序继续往后面进行空间定位南,50米;得到电子眼的空间位置对应的空间坐标信息。
本发明实施例中,通过电子眼罚单数据进行,由于有电子眼罚单产生的地方,就会有电子眼存在,并且确定该电子眼是处于工作状态的电子眼,电子眼罚单中会注明罚单的类型以及罚单的位置,故本发明实施例对电子眼罚单数据进行解析得到电子眼类型以及电子眼罚单地址文字描述信息,并对电子眼罚单地址文字描述信息进行空间位置转换生成电子眼的空间位置信息,这样在地图中制作电子眼数据所需的电子眼的类型以及电子眼的空间位置信息均已获取,使得电子眼数据制作不需要借助第三方数据的辅助也能够完成,在一定程度上降低了地图中电子眼数据制作的复杂性,提高的制作效率。
并且,本发明实施例在进行地址要素提取时,可以先对地址分词的结果进行词性标注,该词性标注在后续的使用非常方便,避免了一遍遍的按照规则进行分析的复杂过程,在很大程度上提升了空间坐标信息的效率。
基于上述方法实施例,本发明实施例还提供一种电子眼数据的处理装置,如图7所示,该装置包括:
获取单元601,用于获取电子眼罚单数据。所述电子眼罚单数据包括电子眼类型以及电子眼罚单地址文字描述信息。
解析单元602,用于对电子眼罚单数据进行解析得到电子眼类型以及电子眼罚单地址文字描述信息。在对电子眼罚单数据进行解析时,会根据获取的电子眼罚单的类型而进行不同的处理,当为文字形式时,直接进行文字识别获取。当为图片形式时,需要对图片进行识别获取。具体的,关于文字识别以及图片识别的相关描述,可以参考现有技术中的已有算法,本发明实施例此处将不再一一描述。
位置转换单元603,用于对电子眼罚单地址文字描述信息进行空间位置转换获取电子眼空间位置信息。该步骤将对文字描述信息进行识别,并进行空间位置转换,使得文字描述的地址信息转换生成为空间位置信息。
在获取了电子眼罚单地址文字描述信息之后,如何通过空间位置转换获取电子眼的空间位置信息,进一步的,如图8所示,所述位置转换单元603包括:
分词模块6031,用于基于预先构建好的地址词典,对所述电子眼罚单地址文字描述信息进行分词,得到多个专有名词。其中,本发明实施例中的地址词典为一个地址库,其可以根据经验收集录入,也可以根据训练录入,具体的,本发明实施对此不进行限制。
选取模块6032,用于从所述多个专有名词中筛选出与地址相关的地址要素词,其可以采用但不局限于以下的两种方式实现,故所述选取模块6032包括:第一选取子模块和/或第一选取子模块。
第一选取子模块,用于基于地址要素形成规则对所述多个专有名词逐一进行分析,从中筛选出地址要素词;其中,当基于地址要素形成规则对所述多个专有名词逐一进行分析,从中筛选出地址要素词时,将所述多个专有名词逐一与地址要素构成规则进行比对,若一致,则确定为地址要素词,否则为非地址要素词。
第二选取子模块,用于根据专有名词的词性标注从所述多个专有名词中筛选出地址要素词。另外,该处需要说明的是,在电子地图领域,每个与地址相关的词都有其分类,例如该词为表述行政区划的词,该词为表示道路的词等等,故在识别词时,可以对该词进行标注,方便后续使用。本发明实施例中所述的词性即为词的类型,是属于行政区划词,还是道路词,还是别的类型的词。该处进行标注的词性可以至少分为以下但又不局限于以下的种类,该种类为政区划、道路、道路和道路间的关系、特别兴趣点等等。对于不同词性的确定,可以通过训练获取。在训练的时候,可以使用但不局限于因马尔科夫模型,本发明实施例对此不进行限制。
在对词进行词性标注时,可以进行单一词性标注或者多词性标注;所述单一词性标注为对一种类型的词进行标注,该种类型的词为行政区划;所述多词性标注为对多种类型的词分别区分标注,该多种类型的词分为行政区划、道路、道路和道路间的关系、特别兴趣点。
该处需要说明的是,一条道路加上行政区划能够唯一的确定一条道路,因为城市之间可能存在相同的道路命名,但是一个城市不可能同时存在两个命名相同的道路,所以在行政区划存在的时候,可以唯一的确定一条道路。故在对词性进行标注时,最简单的就是仅对识别出的词区分是行政区划词,还是非行政区划词。另外由于电子眼罚单的地址文字描述信息本身就有规范的地址命名规则,一般是空间位置从大到小,从区域到具体点位。因此,在对该地址文字描述信息进行分词得到多个专有名词时,其就是一个有一定先后顺序的词序列,只要将第一个行政区划词筛选出来,与词序列中的道路词进行组合,便可以唯一的确定一条路。在进行该行政区划词的词性标注时,可以用任意的标注方式,只要能够区分标注了的词和没有标注的词即可,例如,可以使用单一的标注符号,标注有符号的为行政区划词,没有标注符号的为非行政区划词;还可以使用与非标注法,标注1的为行政区划词,标注0的为非行政区划词,在具体实施时,本发明实施例对此不进行限制。
基于上述描述,所述第二选取子模块具体用于,根据地址要素训练样本对所述专有名词进行词性标注;基于所述词性标注从所述多个专有名词中筛选出地址要素词。
当所述词性标注为单一词性标注时,所述基于所述词性标注从所述多个专有名词中筛选出地址要素词包括:从所述多个专有名词中选取被标注的词,将所选取的词确定为行政区划词;以行政区划词为开始词与其他专有名词进行组合形成新词;将形成的新词按照地址表达规则进行分析;若符合地址表达规则,则确定进行组合的专有名词为地址要素词。
当所述词性标注为多词性标注时,所述基于所述词性标注从所述多个专有名词中筛选出地址要素词包括:从所述多个专有名词中选取有词性标注的词;对词性标注内容进行识别,得到标注词的类型;根据标注词的类型将属于地址要素类型的词确定为地址要素词。
空间坐标位置获取模块6033,用于基于所述地址要素词进行空间筛选及空间推理得到电子眼的空间位置对应的空间坐标信息。其中,所述空间坐标位置获取模块6033包括:
第一查找子模块,用于将所述地址要素词逐一与行政区划库进行比对,确定电子眼所在的行政区划位置信息。在一个国家,其行政区划名字是一定的,而且是唯一的,并且行政区划的空间面积和边界也是唯一的。故从预先设置的行政区划库中查看行政区划是可以唯一的确定出地址要素词所对应行政区划的。该行政区划库中存储着预定空间中的行政区划名称。
该处需要说明的是,在进行地址要素提取时,若对行政区划词进行了标注,则在执行本发明实施例的步骤时,可以仅将该行政区划词与行政区划库进行比对,确定该行政区划词是否在该行政区划库中,若不在,则需要进一步确定是否存在书写错误。若没有对行政区划词进行标注,则需要将所有地址要素词逐一的与所述行政区划库进行比对,确定对应的行政区划。
另外,在执行本步骤时,有可能存在查无结果,即不存在行政区划词的可能性,此时则可以通过道路信息唯一的确定具体的位置空间。因为,现实中,不同的城市可能存在相同的道路命名规则,但是,不可能存在命名规则相同,并且道路和道路之间的关系也相同的两条路,例如在玉溪市有龙马路、东风北路,在洛阳市也有龙马路和东风北路,但是,仅有玉溪市的龙马路和东北北路是相交的,故通过道路之间的位置关系也可以唯一的确定一个空间位置。
第二查找子模块,用于将地址要素词中除行政区划以外的词逐一与预设的道路POI库进行比对,确定所述地址要素词对应的候选道路信息。其中,本发明实施例中,道路的确定,如果行政区划的确定一样,若有词性标注,就仅将对应道路词性标注的地址要素词查询道路POI库即可,若没有词性标注,就将所有的地址要素词逐一查询道路POI库确定对应的道路信息,具体的本发明实施例在此不再赘述。
空间筛选子模块,用于通过所述电子眼所在的行政区划位置信息对所述候选道路信息进行空间筛选,得到所述电子眼所在的道路位置信息。
获取子模块,用于获取所述地址要素中除所述行政区划以及道路信息对应词外的剩余地址要素词。
空间推理子模块,用于在所述道路位置信息的基础上,利用所述剩余地址要素词对电子眼的空间位置进行空间推理,得到电子眼的空间位置对应的空间坐标信息。
本发明实施例中电子眼数据的处理装置组成单元及模块的其他描述,可以参考方法实施例的相关描述,本发明实施例此处将不再赘述。
本发明实施例还提供一种服务器,包括至少一处理器,一存储介质,所述存储介质用于存储所述处理器执行的程序,以及所述处理器执行所述程序过程中所需的数据;
其中,所述程序被处理器执行时实现如上所述电子眼数据的处理方法的步骤。
本发明实施例中,其通过电子眼罚单数据进行,由于有电子眼罚单产生的地方,就会有电子眼存在,并且确定该电子眼是处于工作状态的电子眼,电子眼罚单中会注明罚单的类型以及罚单的位置,故本发明实施例对电子眼罚单数据进行解析得到电子眼类型以及电子眼罚单地址文字描述信息,并对电子眼罚单地址文字描述信息进行解析获取电子眼空间位置信息,这样在地图中制作电子眼数据所需的电子眼的类型以及电子眼的空间位置信息均已获取,使得电子眼数据制作不需要借助第三方数据的辅助也能够完成,在一定程度上降低了地图中电子眼数据制作的复杂性,提高的制作效率。
并且,本发明实施例在进行地址要素提取时,可以先对地址分词的结果进行词性标注,该词性标注在后续的使用非常方便,避免了一遍遍的按照规则进行分析的复杂过程,在很大程度上提升了空间坐标信息的效率。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (13)
1.一种电子眼数据的处理方法,其特征在于,包括:
获取电子眼罚单数据;
对电子眼罚单数据进行解析得到电子眼类型以及电子眼罚单地址文字描述信息;
对电子眼罚单地址文字描述信息进行空间位置转换生成电子眼的空间位置信息。
2.根据权利要求1所述的方法,其特征在于,所述对电子眼罚单地址进行空间位置转换生成电子眼的空间位置信息包括:
基于预先构建好的地址词典,对所述电子眼罚单地址文字描述信息进行分词,得到多个专有名词;
从所述多个专有名词中筛选出与地址相关的地址要素词;
基于所述地址要素词进行空间筛选及空间推理得到电子眼的空间位置对应的空间坐标信息。
3.根据权利于2所述的方法,其特征在于,从所述多个专有名词中筛选出与地址相关的地址要素词包括:
基于地址要素形成规则对所述多个专有名词逐一进行分析,从中筛选出地址要素词;
或者,
根据专有名词的词性标注从所述多个专有名词中筛选出地址要素词。
4.根据权利要求3所述的方法,根据专有名词的词性标注从所述多个专有名词中筛选出地址要素词包括:
根据地址要素训练样本对所述专有名词进行词性标注;
基于所述词性标注从所述多个专有名词中筛选出地址要素词。
5.根据权利要求4所述的方法,其特征在于,所述词性标注分为单一词性标注或者多词性标注;
所述单一词性标注为对一种类型的词进行标注,该种类型的词为行政区划;
所述多词性标注为对多种类型的词分别区分标注,该多种类型的词分为行政区划、道路、道路和道路间的关系、特别兴趣点。
6.根据权利要求5所述的方法,其特征在于,当所述词性标注为单一词性标注时,所述基于所述词性标注从所述多个专有名词中筛选出地址要素词包括:
从所述多个专有名词中选取被标注的词,将所选取的词确定为行政区划词;
以行政区划词为开始词与其他专有名词进行组合形成新词;
将形成的新词按照地址表达规则进行分析;
若符合地址表达规则,则确定进行组合的专有名词为地址要素词。
7.根据权利要求5所述的方法,其特征在于,当所述词性标注为多词性标注时,所述基于所述词性标注从所述多个专有名词中筛选出地址要素词包括:
从所述多个专有名词中选取有词性标注的词;
对词性标注内容进行识别,得到标注词的类型;
根据标注词的类型将属于地址要素类型的词确定为地址要素词。
8.根据权利要求2-7中任一项所述的方法,其特征在于,基于所述地址要素词进行空间筛选及空间推理得到电子眼的空间位置对应的空间坐标信息包括:
将所述地址要素词逐一与行政区划库进行比对,确定电子眼所在的行政区划位置信息;
将地址要素词中除行政区划以外的词逐一与预设的道路POI库进行比对,确定所述地址要素词对应的候选道路信息;
通过所述电子眼所在的行政区划位置信息对所述候选道路信息进行空间筛选,得到所述电子眼所在的道路位置信息;
获取所述地址要素中除所述行政区划以及道路信息对应词外的剩余地址要素词;
在所述道路位置信息的基础上,利用所述剩余地址要素词对电子眼的空间位置进行空间推理,得到电子眼的空间位置对应的空间坐标信息。
9.一种电子眼数据的处理装置,其特征在于,包括:
获取单元,用于获取电子眼罚单数据;
解析单元,用于对电子眼罚单数据进行解析得到电子眼类型以及电子眼罚单地址文字描述信息;
位置转换单元,用于对电子眼罚单地址文字描述信息进行空间位置转换生成电子眼的空间位置信息。
10.根据权利要求9所述的装置,其特征在于,位置转换单元包括:
分词模块,用于基于预先构建好的地址词典,对所述电子眼罚单地址文字描述信息进行分词,得到多个专有名词;
选取模块,用于从所述多个专有名词中筛选出与地址相关的地址要素词;
空间坐标位置获取模块,用于基于所述地址要素词进行空间筛选及空间推理得到电子眼的空间位置对应的空间坐标信息。
11.根据权利于10所述的装置,其特征在于,所述选取模块包括:
第一选取子模块,用于基于地址要素形成规则对所述多个专有名词逐一进行分析,从中筛选出地址要素词;
和/或
第二选取子模块,用于根据专有名词的词性标注从所述多个专有名词中筛选出地址要素词。
12.根据权利要求10或11所述的装置,其特征在于,空间坐标位置获取模块包括:
第一查找子模块,用于将所述地址要素词逐一与行政区划库进行比对,确定电子眼所在的行政区划位置信息;
第二查找子模块,用于将地址要素词中除行政区划以外的词逐一与预设的道路POI库进行比对,确定所述地址要素词对应的候选道路信息;
空间筛选子模块,用于通过所述电子眼所在的行政区划位置信息对所述候选道路信息进行空间筛选,得到所述电子眼所在的道路位置信息;
获取子模块,用于获取所述地址要素中除所述行政区划以及道路信息对应词外的剩余地址要素词;
空间推理子模块,用于在所述道路位置信息的基础上,利用所述剩余地址要素词对电子眼的空间位置进行空间推理,得到电子眼的空间位置对应的空间坐标信息。
13.一种服务器,其特征在于,包括至少一处理器,一存储介质,所述存储介质用于存储所述处理器执行的程序,以及所述处理器执行所述程序过程中所需的数据;
其中,所述程序被处理器执行时实现权利要求1-8中任一项所述电子眼数据的处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910022800.6A CN111427977B (zh) | 2019-01-10 | 2019-01-10 | 电子眼数据的处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910022800.6A CN111427977B (zh) | 2019-01-10 | 2019-01-10 | 电子眼数据的处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111427977A true CN111427977A (zh) | 2020-07-17 |
CN111427977B CN111427977B (zh) | 2023-12-19 |
Family
ID=71546095
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910022800.6A Active CN111427977B (zh) | 2019-01-10 | 2019-01-10 | 电子眼数据的处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111427977B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112612907A (zh) * | 2021-01-04 | 2021-04-06 | 上海明略人工智能(集团)有限公司 | 知识图谱的生成方法、装置、电子设备和计算机可读介质 |
CN114646329A (zh) * | 2022-05-18 | 2022-06-21 | 阿里巴巴(中国)有限公司 | 导航提示方法、装置、电子设备及可读存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001067354A (ja) * | 1999-08-27 | 2001-03-16 | Matsushita Electric Ind Co Ltd | 新語性判定装置及び新語性判定方法 |
KR20040018008A (ko) * | 2002-08-24 | 2004-03-02 | 한국전자통신연구원 | 품사 태깅 장치 및 태깅 방법 |
CN101350012A (zh) * | 2007-07-18 | 2009-01-21 | 北京灵图软件技术有限公司 | 一种地址匹配的方法和系统 |
CN102169498A (zh) * | 2011-04-14 | 2011-08-31 | 中国测绘科学研究院 | 一种地址模型的构建方法,以及地址匹配的方法和系统 |
US20110244882A1 (en) * | 2010-03-03 | 2011-10-06 | Wgrs Licensing Company, Llc | Systems and methods for creating and using imbedded shortcodes and shortened physical and internet addresses |
CN103914544A (zh) * | 2014-04-03 | 2014-07-09 | 浙江大学 | 一种基于地址特征词的多层次快速中文地址匹配方法 |
CN105022748A (zh) * | 2014-04-28 | 2015-11-04 | 北京图盟科技有限公司 | 一种运单地址分级方法及装置 |
CN106920461A (zh) * | 2015-12-24 | 2017-07-04 | 北京四维图新科技股份有限公司 | 一种生成电子眼分布地图的方法及装置 |
CN107423295A (zh) * | 2016-05-24 | 2017-12-01 | 张向利 | 一种海量地址数据智能快速匹配方法 |
CN109033086A (zh) * | 2018-08-03 | 2018-12-18 | 银联数据服务有限公司 | 一种地址解析、匹配的方法及装置 |
-
2019
- 2019-01-10 CN CN201910022800.6A patent/CN111427977B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001067354A (ja) * | 1999-08-27 | 2001-03-16 | Matsushita Electric Ind Co Ltd | 新語性判定装置及び新語性判定方法 |
KR20040018008A (ko) * | 2002-08-24 | 2004-03-02 | 한국전자통신연구원 | 품사 태깅 장치 및 태깅 방법 |
CN101350012A (zh) * | 2007-07-18 | 2009-01-21 | 北京灵图软件技术有限公司 | 一种地址匹配的方法和系统 |
US20110244882A1 (en) * | 2010-03-03 | 2011-10-06 | Wgrs Licensing Company, Llc | Systems and methods for creating and using imbedded shortcodes and shortened physical and internet addresses |
CN102169498A (zh) * | 2011-04-14 | 2011-08-31 | 中国测绘科学研究院 | 一种地址模型的构建方法,以及地址匹配的方法和系统 |
CN103914544A (zh) * | 2014-04-03 | 2014-07-09 | 浙江大学 | 一种基于地址特征词的多层次快速中文地址匹配方法 |
CN105022748A (zh) * | 2014-04-28 | 2015-11-04 | 北京图盟科技有限公司 | 一种运单地址分级方法及装置 |
CN106920461A (zh) * | 2015-12-24 | 2017-07-04 | 北京四维图新科技股份有限公司 | 一种生成电子眼分布地图的方法及装置 |
CN107423295A (zh) * | 2016-05-24 | 2017-12-01 | 张向利 | 一种海量地址数据智能快速匹配方法 |
CN109033086A (zh) * | 2018-08-03 | 2018-12-18 | 银联数据服务有限公司 | 一种地址解析、匹配的方法及装置 |
Non-Patent Citations (1)
Title |
---|
赵英;占斌斌;贾沛哲;李华英;: "基于规则与词典的地址匹配算法", 北京测绘, no. 05, pages 53 - 57 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112612907A (zh) * | 2021-01-04 | 2021-04-06 | 上海明略人工智能(集团)有限公司 | 知识图谱的生成方法、装置、电子设备和计算机可读介质 |
CN114646329A (zh) * | 2022-05-18 | 2022-06-21 | 阿里巴巴(中国)有限公司 | 导航提示方法、装置、电子设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111427977B (zh) | 2023-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110008300B (zh) | Poi别名的确定方法、装置、计算机设备和存储介质 | |
CN111522901B (zh) | 文本中地址信息的处理方法及装置 | |
CN109145281B (zh) | 语音识别方法、装置及存储介质 | |
CN107590123B (zh) | 车载中地点上下文指代消解方法及装置 | |
US11403766B2 (en) | Method and device for labeling point of interest | |
CN110609879B (zh) | 兴趣点判重方法、装置、计算机设备及存储介质 | |
CN110309432B (zh) | 基于兴趣点的同义词确定方法、地图兴趣点处理方法 | |
CN111522892A (zh) | 地理要素的检索方法及装置 | |
CN112307180A (zh) | 一种基于标签对象的快速检索方法及设备 | |
CN115203354B (zh) | 一种车码轨迹预关联方法、装置、计算机设备及存储介质 | |
CN111797772B (zh) | 发票图像自动分类方法、系统、装置 | |
CN111427977B (zh) | 电子眼数据的处理方法及装置 | |
CN111427976B (zh) | 道路鲜度的获取方法及装置 | |
CN116955541B (zh) | 融合地理要素语义分割与相似度的地址匹配方法和系统 | |
CN112711645B (zh) | 一种位置点信息扩展方法、装置、存储介质和电子设备 | |
CN113821702A (zh) | 一种城市多维空间多元异构信息数据处理方法 | |
CN107247716B (zh) | 一种增加电子眼信息的方法及装置、导航芯片及服务器 | |
CN116413740B (zh) | 一种激光雷达点云地面检测方法及装置 | |
CN106996784B (zh) | 一种移动设备、导航路测方法及系统 | |
CN113626729B (zh) | 兴趣点信息的确定方法及设备 | |
CN106649315A (zh) | 处理路径导航的方法和装置 | |
CN114896353A (zh) | 一种地理编码方法、存储介质及系统 | |
CN115186240A (zh) | 基于关联性信息的社交网络用户对齐方法、装置、介质 | |
CN113010727A (zh) | 直播平台画像的构建方法、装置、设备及存储介质 | |
Groenen et al. | Panorams: automatic annotation for detecting objects in urban context |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |