CN106021276A - 基于分布式全文检索系统的卡口车辆搜索的方法及系统 - Google Patents

基于分布式全文检索系统的卡口车辆搜索的方法及系统 Download PDF

Info

Publication number
CN106021276A
CN106021276A CN201610274064.XA CN201610274064A CN106021276A CN 106021276 A CN106021276 A CN 106021276A CN 201610274064 A CN201610274064 A CN 201610274064A CN 106021276 A CN106021276 A CN 106021276A
Authority
CN
China
Prior art keywords
text
distributed
information
vehicle
distributed full
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610274064.XA
Other languages
English (en)
Inventor
李庆功
辛国茂
马述杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taihua Wisdom Industry Group Co Ltd
Original Assignee
Taihua Wisdom Industry Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taihua Wisdom Industry Group Co Ltd filed Critical Taihua Wisdom Industry Group Co Ltd
Priority to CN201610274064.XA priority Critical patent/CN106021276A/zh
Publication of CN106021276A publication Critical patent/CN106021276A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution

Abstract

本发明公开基于分布式全文检索系统的卡口车辆搜索的方法,包括:获取由卡口的过车图片解析后生成的过车图片的文本描述信息;根据过车图片的文本描述信息的主要字段设置分布式全文检索系统配置文件;按分布式全文检索系统配置文件将过车图片的文本描述信息解析索引到分布式全文检索系统数据库中,在分布式全文检索系统数据库中建立倒排索引并进行分布式存储;接收卡口车辆搜索请求,并解析出所要搜索的目标卡口车辆属性;根据目标卡口车辆属性从分布式全文检索系统数据库中查找到目标卡口车辆信息并进行反馈。本发明加快了卡口车辆搜索、查询的效率。

Description

基于分布式全文检索系统的卡口车辆搜索的方法及系统
技术领域
本发明涉及卡口车辆信息搜索的技术领域,具体地,涉及一种基于分布式全文检索系统的卡口车辆搜索的方法及系统。
背景技术
近年来,随着互联网技术及信息处理技术的发展,各种信息的智能化分析及处理成为业内的热门研究内容。加上现今各地的交通设备的大量增加,交通信息工程的建设,为人们的日常生活提供了丰富的信息资源的同时,也增加了交通信息数据的分析处理量。车辆已经成为了人们生活中必不可少的交通工具,每天在各地都会有大量的车辆信息,通过对各地的这些车辆信息数据进行分析可以获取许多重要的信息、情报。
在现今的交通管理系统中,卡口系统用于采用光电技术、图像处理技术、模式识别技术等技术拍下过往各个卡口的每一辆车辆的图像,识别出车辆的牌照等信息,并将所采集到的车辆信息数据保存在服务器数据库中。卡口系统通过上述各种技术手段最终生成简单的过车信息,包括:车牌号、车型、车身颜色、车牌颜色、过车时间、行驶速度、卡口编号等。但是,随着各地智能交通信息系统工程的持续建设和投入,交通设备设施的大量增加,以及人们对车辆的依赖性增强,导致卡口系统产生的过车数据迅速膨胀。现有技术将这些过车数据存储在关系型数据库中,日积月累这些数据可能有千万条,甚至几亿、几十亿条数据。
关系型数据库以行和列形成交叉二维表的形式存储数据,在交叉二维表中,每一行定义实体集的一个实体;每一列定义实体集的一个属性特征。在卡口系统产生过车信息的速度快,且各个卡口产生的过车信息集合起来数据量大,按照二维表的实体即属性特征进行存储,会因为存储数据量大增加存储成本,还会因为较大存储数据的二维表中不能快速查询到数据的存储定位而不能实时地进行数据存储。并且关系型数据库的二维表中不能体现各个数据之间的联系,会造成后续管理不方便的问题。再者,由于庞大的数据存储量,后续对数据库的应用中,从庞大的数据中快速地查找到目标数据就显得更为重要,而按照现有技术的存储方式,每次查找数据都需要遍历整个二维表中存储的庞大数据,造成查询效率低下。
因此,提供一种高效易实施的卡口车辆信息搜索的方法是本领域亟待解决的问题。
发明内容
有鉴于此,本发明提供了一种基于分布式全文检索系统的卡口车辆搜索的方法及系统,解决了在卡口车辆信息存储数据库中进行卡口车辆搜索效率低下的问题。
为了解决上述技术问题,本发明提出一种基于分布式全文检索系统的卡口车辆搜索的方法,包括:
获取由卡口的过车图片解析后生成的过车图片的文本描述信息,所述过车图片的文本描述信息至少包括:车牌号、车型、车身颜色、车牌颜色、卡口信息及过车时间,其中,所述过车图片的文本描述信息通过分布式发布订阅消息系统进行缓存;
根据所述过车图片的文本描述信息的主要字段设置分布式全文检索系统配置文件;
按所述分布式全文检索系统配置文件将所述过车图片的文本描述信息解析索引到分布式全文检索系统数据库中,在所述分布式全文检索系统数据库中建立倒排索引并进行分布式存储;
接收卡口车辆搜索请求,并解析出所要搜索的目标卡口车辆属性;
根据所述目标卡口车辆属性从所述分布式全文检索系统数据库中查找到目标卡口车辆信息并进行反馈。
进一步地,其中,所述主要字段至少包括:车牌号、车型、车身颜色、车牌颜色。
进一步地,其中,所述在所述分布式全文检索系统数据库中建立倒排索引,包括:
根据所述过车图片的文本描述信息的主要字段设置关键词索引,并以所述过车图片的文本描述信息的分布式全文检索系统数据的文档编号为索引内容建立倒排索引。
进一步地,其中,所述根据所述目标卡口车辆属性从所述分布式全文检索系统数据库中查找到目标卡口车辆信息并进行反馈,包括:
根据所述目标卡口车辆属性设置索引;
基于该索引从所述分布式全文检索系统数据库中查找到相应的目标卡口车辆信息的文档编号;
再通过查找到的文档编号获取目标卡口车辆信息并进行反馈。
进一步地,其中,所述分布式存储由至少两台物理机进行存储,并通过分布式服务框架管理各个存储节点。
另外,本发明还提供一种基于分布式全文检索系统的卡口车辆搜索的系统,所述系统包括:获取模块、配置模块、存储模块、接收模块及处理模块,其中,
所述获取模块,用于获取由卡口的过车图片解析后生成的过车图片的文本描述信息,所述过车图片的文本描述信息至少包括:车牌号、车型、车身颜色、车牌颜色、卡口信息及过车时间,其中,所述过车图片的文本描述信息通过分布式发布订阅消息系统进行缓存;
所述配置模块,用于根据所述过车图片的文本描述信息的主要字段设置分布式全文检索系统配置文件;
所述存储模块,用于按所述分布式全文检索系统配置文件将所述过车图片的文本描述信息解析索引到分布式全文检索系统数据库中,在所述分布式全文检索系统数据库中建立倒排索引并进行分布式存储;
所述接收模块,用于接收卡口车辆搜索请求,并解析出所要搜索的目标卡口车辆属性;
所述处理模块,用于根据所述目标卡口车辆属性从所述分布式全文检索系统数据库中查找到目标卡口车辆信息并进行反馈。
进一步地,其中,所述主要字段至少包括:车牌号、车型、车身颜色、车牌颜色。
进一步地,其中,所述存储模块,用于根据所述过车图片的文本描述信息的主要字段设置关键词索引,并以所述过车图片的文本描述信息的分布式全文检索系统数据的文档编号为索引内容建立倒排索引。
进一步地,其中,所述处理模块,用于:
根据所述目标卡口车辆属性设置索引;
基于该索引从所述分布式全文检索系统数据库中查找到相应的目标卡口车辆信息的文档编号;
再通过查找到的文档编号获取目标卡口车辆信息并进行反馈。
进一步地,其中,所述分布式存储由至少两台物理机进行存储,并通过分布式服务框架管理各个存储节点。
与现有技术相比,本发明的基于分布式全文检索系统的卡口车辆搜索的方法及系统,实现了如下的有益效果:
(1)本发明所述的基于分布式全文检索系统的卡口车辆搜索的方法及系统,基于分布式全文检索系统采用分布式存储卡口的过车图片的文本描述信息,可以通过设置多台廉价的物理机进行数据存储,再利用一台物理机统一管理,数据存储量增加时还可以增加物理机,降低了庞大的卡口过车图片的文本描述信息数据的存储成本。
(2)本发明所述的基于分布式全文检索系统的卡口车辆搜索的方法及系统,基于分布式全文检索系统建立倒排索引,方便通过用户的卡口车辆搜索请求中的关键词进行快速查找,同时,还可以基于分布式存储采用并行式的查找,大大加快了卡口车辆搜索、查询的效率。
当然,实施本发明的任一产品必不一定需要同时达到以上所述的所有技术效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明的基于分布式全文检索系统的卡口车辆搜索的方法的一个可选实施例的流程示意图;
图2为本发明实施例1所述基于分布式全文检索系统的卡口车辆搜索的方法中,倒排索引的索引词与相应文档的结构示意图;
图3为本发明实施例2所述基于分布式全文检索系统的卡口车辆搜索的方法的一个可选实施例的流程示意图;
图4为本实施例2中应用基于分布式全文检索系统的卡口车辆搜索的方法的系统设备结构示意图;
图5为本实施例3中所述基于分布式全文检索系统的卡口车辆搜索的方法的流程示意图;
图6为本实施例4中公开的基于分布式全文检索系统的卡口车辆搜索的系统的一个可选实施例的结构示意图。
具体实施方式
如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语,故应解释成“包含但不限定于”。“大致”是指在可接收的误差范围内,本领域技术人员能够在一定误差范围内解决所述技术问题,基本达到所述技术效果。说明书后续描述为实施本发明的较佳实施方式,然所述描述乃以说明本发明的一般原则为目的,并非用以限定本发明的范围。本发明的保护范围当视所附权利要求所界定者为准。
实施例1
如图1所示,为本发明的基于分布式全文检索系统的卡口车辆搜索的方法的一个可选实施例的流程示意图,本发明基于分布式全文检索系统设计卡口过车信息的倒排索引并进行分布式存储,加快了卡口车辆搜索的效率。本实施例中所述分布式全文检索系统的卡口车辆搜索的方法包括以下步骤:
步骤101、获取由卡口的过车图片解析后生成的过车图片的文本描述信息,所述过车图片的文本描述信息至少包括:车牌号、车型、车身颜色、车牌颜色、卡口信息及过车时间,其中,所述过车图片的文本描述信息通过分布式发布订阅消息系统(kafka)进行缓存。
过车图片的文本描述信息(VSD过车信息)是由缓存卡口或电警等前端设备产生的过车图片后进过解析后生成的,VSD过车信息包含:车牌号、车型、颜色、过车时间、卡口信息等信息。
优选地,所述过车图片的文本描述信息通过分布式发布订阅消息系统缓存在消息服务器中,本步骤从消息服务器中获取过车图片的文本描述信息,而分布式发布订阅消息系统是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。分布式发布订阅消息系统具有如下特性:(1)通过磁盘数据结构提供消息的持久化,这种结构对于即使数以TB的消息存储也能够保持长时间的稳定性能;(2)高吞吐量;(3)支持通过分布式发布订阅消息系统服务器和消费机集群来分区消息;(4)支持分布式计算(Hadoop)并行数据加载,可以加快数据的加载传输;(5)产生和消费消息时自动负载均衡。在本步骤中,只要检测到分布式发布订阅消息系统中有数据就会读取出来进行解析索引。
步骤102、根据所述过车图片的文本描述信息的主要字段设置分布式全文检索系统的配置文件。
分布式全文检索系统(SOLRCLOUD)是基于全文搜索服务器(solr)和分布式服务框架(zookeeper)的分布式搜索方案,solr是一个独立的企业级搜索应用服务器,它对外提供接口,用户可以通过发送请求,向搜索引擎服务器提交一定格式(例如XML格式)的文件生成索引;也可以通过相关的获取操作提出查找请求,并得到返回结果。分布式服务框架(zookeeper)是Hadoop的开源子项目,在分布式系统架构中大量的被运用,从而减少分布式架构的复杂度。分布式全文检索系统(SOLRCLOUD)是使用zookeeper作为集群的配置信息中心,通过分布式服务框架(zookeeper)进行全文搜索服务器(solr)各节点之间的信息同步。而分布式全文检索系统(SOLRCLOUD)采用分布式的存储方式,对索引进行分片,并对每个分片创建多个数据复制(Replication)。每个Replication都可以对外提供服务,一个Replication故障不会影响索引服务,更强大的是,它还能自动的在其它机器上帮你把失败机器上的索引Replication重建并投入使用。
分布式全文检索系统有如下几个特色:(1)集中式的配置信息;(2)自动容错;(3)近实时搜索:(4)查询时自动负载均衡。用户只需要在配置文件中配置好要索引的过车信息字段(如:车牌号、车型、类别、车身颜色、车牌颜色、过车时间、卡口编号等),并将此配置文件和分布式全文检索系统中其它配置文件一起上传到zookeeper中,然后利用此配置文件创建好类聚框架(collection),在创建collection时还可以设置副本数以存储要索引的过车数据,启动分布式全文检索系统集群,即可提供对车辆的索引和搜索功能。
优选地,在本步骤中,消息消费者从上述的消息服务器中读取已缓存的过车图片的文本描述信息,并把这些过车信息按分布式全文检索系统配置文件中配置好的字段解析索引到分布式全文检索系统数据库里。其中,所述配置文件是根据所述过车图片的文本描述信息的主要字段预先设置的,例如,在配置文件中,设置名称字段对应过车信息字段的英文名:carPlateNo对应车牌号、carColor对应车身颜色。
步骤103、按所述分布式全文检索系统配置文件将所述过车图片的文本描述信息解析索引到分布式全文检索系统数据库中,在所述分布式全文检索系统数据库中建立倒排索引并进行分布式存储。
优选地,在本步骤中,采用分布式全文检索系统集群索引并存储过车图片的文本描述信息,过车图片的文本描述信息是以配置文件中配置的字段进行倒排索引,倒排索引与正排索引的区别是:正排索引是由文档编号找词,而倒排索引是由词找文档编号,倒排索引的形式如图2所示。
步骤104、接收卡口车辆搜索请求,并解析出所要搜索的目标卡口车辆属性。
用户通过分布式全文检索系统提供的接口发送卡口车辆搜索请求,分布式全文检索系统接收到该请求后提取其中的目标卡口车辆属性以生成查询的关键词。
步骤105、根据所述目标卡口车辆属性从所述分布式全文检索系统数据库中查找到目标卡口车辆信息并进行反馈。
本实施例的基于分布式全文检索系统的卡口车辆搜索的方法,基于分布式全文检索系统采用分布式存储卡口的过车图片的文本描述信息,可以通过设置多台廉价的物理机进行数据存储,降低了庞大的卡口过车图片的文本描述信息数据的存储成本。还通过建立倒排索引,方便通过用户的卡口车辆搜索请求中的关键词进行快速查找,以及基于分布式存储采用并行式的查找方式,大大加快了卡口车辆搜索、查询的效率,实现了实时查询的目的。
实施例2
如图3所示,为本发明实施例2的基于分布式全文检索系统的卡口车辆搜索的方法。在本实施例中,设置了基于分布式全文检索系统建立过车图片的文本描述信息倒排索引以及查找目标卡口车辆信息的具体方法。本实施例中基于分布式全文检索系统的卡口车辆搜索的方法包括以下步骤:
步骤201、获取由卡口的过车图片解析后生成的过车图片的文本描述信息,所述过车图片的文本描述信息至少包括:车牌号、车型、车身颜色、车牌颜色、卡口信息及过车时间,其中,所述过车图片的文本描述信息通过分布式发布订阅消息系统进行缓存。
步骤202、根据所述过车图片的文本描述信息的主要字段设置分布式全文检索系统配置文件。所述主要字段至少包括:车牌号、车型、车身颜色、车牌颜色。
步骤203、按所述分布式全文检索系统配置文件将所述过车图片的文本描述信息解析索引到分布式全文检索系统数据库中,根据所述过车图片的文本描述信息的主要字段设置关键词索引,并以所述过车图片的文本描述信息的分布式全文检索系统数据的文档编号为索引内容建立倒排索引并进行分布式存储。所述分布式存储由至少两台物理机进行存储,并通过分布式服务框架管理各个存储节点。
步骤204、接收卡口车辆搜索请求,并解析出所要搜索的目标卡口车辆属性。
步骤205、根据所述目标卡口车辆属性设置分布式全文检索系统索引。
步骤206、基于该索引从所述分布式全文检索系统数据库中查找到相应的目标卡口车辆信息的文档编号。
步骤207、再通过查找到的文档编号获取目标卡口车辆信息并进行反馈。
当根据用户的关键词对卡口车辆进行搜索时,会找到该词出现过的所有文档编号,然后再通过该文档编号寻找文档的具体内容,不用遍历所有文档的具体内容,以达到高效搜索的目的。
在本实施例中,该基于分布式全文检索系统的卡口车辆搜索的方法可应用在系统设备中,如图4所示,为应用本实施例基于分布式全文检索系统的卡口车辆搜索的方法的系统设备结构示意图。在图4中,卡口或电警等前端设备001采集过车图片,传送至消息服务器002;所述消息服务器缓存卡口或电警等前端设备产生的过车图片解析生成的过车图片的文本描述信息;消费者003从所述消息服务器002读取已缓存的过车信息,并把这些过车信息按分布式全文检索系统配置文件中配置好的字段解析索引到分布式全文检索系统搜索引擎004的分布式全文检索系统数据库里,所述分布式全文检索系统搜索引擎004根据所述过车图片的文本描述信息的主要字段设置关键词索引,并以所述过车图片的文本描述信息的分布式全文检索系统数据的文档编号为索引内容建立倒排索引并进行分布式存储到分布式全文检索系统数据库中;当用户通过终端005发送卡口车辆搜索请求时,终端的卡口车辆搜索应用程序将该卡口车辆搜索请求传输至所述分布式全文检索系统搜索引擎004,按照请求中设置的关键词在分布式全文检索系统搜索引擎004中进行卡口车辆搜索并反馈搜索结果。
实施例3
如图5所示,为本发明实施例3所述基于分布式全文检索系统的卡口车辆搜索的方法的一个可选实施例。在本实施例,具体设置了基于分布式全文检索系统存储各个卡口的过车图片的文本描述信息以及进行卡口车辆搜索的方法。本实施例的步骤如下:
步骤301、在消息服务器上安装分布式发布订阅消息系统并配置环境变量,缓存卡口或电警等前端设备产生的过车图片解析生成的过车图片的文本描述信息(VSD过车信息)。VSD过车信息包含车牌号、车型、颜色、过车时间等信息。
步骤302、基于2n+1(n>=1)台服务器搭建分布式全文检索系统集群,创建这些服务器两两之间无密码登陆进行连接并在各个服务器上安装好软件开发工具包。
步骤303、在所述分布式全文检索系统集群下安装分布式服务框架(zookeeper)。
步骤304、在所述分布式全文检索系统配置文件中添加要索引的字段,并上传到分布式服务框架中。
步骤305、使用分布式全文检索系统命令指定分布式全文检索系统配置文件创建类聚框架(collection),用于存放索引的过车信息。
步骤306、启动分布式全文检索系统集群。
步骤307、获取由卡口的过车图片解析后生成的过车图片的文本描述信息。
步骤308、按所述分布式全文检索系统配置文件将所述过车图片的文本描述信息解析索引到分布式全文检索系统数据库中,在所述分布式全文检索系统数据库中建立倒排索引并进行分布式存储。
步骤309、接收卡口车辆搜索请求,并解析出所要搜索的目标卡口车辆属性。
步骤310、根据所述目标卡口车辆属性从所述分布式全文检索系统数据库中查找到目标卡口车辆信息并进行反馈。
实施例4
如图6所示,为本实施例中公开的基于分布式全文检索系统的卡口车辆搜索的系统的一个可选实施例的结构示意图。本实施例中所述的基于分布式全文检索系统的卡口车辆搜索的系统包括:获取模块401、配置模块402、存储模块403、接收模块404及处理模块405,其中,
所述获取模块401,与所述配置模块402相藕接,用于获取由卡口的过车图片解析后生成的过车图片的文本描述信息,所述过车图片的文本描述信息至少包括:车牌号、车型、车身颜色、车牌颜色、卡口信息及过车时间,其中,所述过车图片的文本描述信息通过分布式发布订阅消息系统进行缓存。
所述配置模块402,与所述获取模块401及存储模块403相藕接,用于根据所述过车图片的文本描述信息的主要字段设置分布式全文检索系统配置文件。其中,所述主要字段至少包括:车牌号、车型、车身颜色、车牌颜色。
所述存储模块403,与所述配置模块402、接收模块404及处理模块相藕接,用于按所述分布式全文检索系统配置文件将所述过车图片的文本描述信息解析索引到分布式全文检索系统数据库中,在所述分布式全文检索系统数据库中建立倒排索引并进行分布式存储。
所述接收模块404,与所述存储模块403相藕接,用于接收卡口车辆搜索请求,并解析出所要搜索的目标卡口车辆属性。
所述处理模块405,与所述存储模块403相藕接,用于根据所述目标卡口车辆属性从所述分布式全文检索系统数据库中查找到目标卡口车辆信息并进行反馈。
上述的存储模块403,进一步用于根据所述过车图片的文本描述信息的主要字段设置关键词索引,并以所述过车图片的文本描述信息的分布式全文检索系统数据的文档编号为索引内容建立倒排索引。
所述处理模块405,进一步用于根据所述目标卡口车辆属性设置索引;
基于该索引从所述分布式全文检索系统数据库中查找到相应的目标卡口车辆信息的文档编号;
再通过查找到的文档编号获取目标卡口车辆信息并进行反馈。
在本实施例的基于分布式全文检索系统的卡口车辆搜索的系统中,所述分布式存储由至少两台物理机进行存储,并通过分布式服务框架(zookeeper)管理各个存储节点。
在本发明中,过车数据的存储与查询均基于分布式全文检索系统建立在分布式系统架构上,利用大数据平台技术将过车数据保存到分布式存储系统中,按照倒排索引建立索引机制,且在存储的过程中已经按照需求进行了基础统计工作,用户终端通过请求可快速地从数据库中查询并获取到所需的过车数据。且在本实施例中,数据库采用分布式存储的方式,用户终端可以在分布式存储服务器上并行地进行查询,提高了查询的效率。
通过以上各个实施例可知,本发明的基于分布式全文检索系统的卡口车辆搜索的方法及系统存在的有益效果是:
(1)本发明所述的基于分布式全文检索系统的卡口车辆搜索的方法及系统,基于分布式全文检索系统采用分布式存储卡口的过车图片的文本描述信息,可以通过设置多台廉价的物理机进行数据存储,再利用一台物理机统一管理,数据存储量增加时还可以增加物理机,降低了庞大的卡口过车图片的文本描述信息数据的存储成本。
(2)本发明所述的基于分布式全文检索系统的卡口车辆搜索的方法及系统,基于分布式全文检索系统建立倒排索引,方便通过用户的卡口车辆搜索请求中的关键词进行快速查找,同时,还可以基于分布式存储采用并行式的查找,大大加快了卡口车辆搜索、查询的效率。
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
上述说明示出并描述了本发明的若干可选实施例,但如前所述,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (10)

1.一种基于分布式全文检索系统的卡口车辆搜索的方法,其特征在于,包括:
获取由卡口的过车图片解析后生成的过车图片的文本描述信息,所述过车图片的文本描述信息至少包括:车牌号、车型、车身颜色、车牌颜色、卡口信息及过车时间,其中,所述过车图片的文本描述信息通过分布式发布订阅消息系统进行缓存;
根据所述过车图片的文本描述信息的主要字段设置分布式全文检索系统配置文件;
按所述分布式全文检索系统配置文件将所述过车图片的文本描述信息解析索引到分布式全文检索系统数据库中,在所述分布式全文检索系统数据库中建立倒排索引并进行分布式存储;
接收卡口车辆搜索请求,并解析出所要搜索的目标卡口车辆属性;
根据所述目标卡口车辆属性从所述分布式全文检索系统数据库中查找到目标卡口车辆信息并进行反馈。
2.根据权利要求1所述的基于分布式全文检索系统的卡口车辆搜索的方法,其特征在于,所述主要字段至少包括:车牌号、车型、车身颜色、车牌颜色。
3.根据权利要求1所述的基于分布式全文检索系统的卡口车辆搜索的方法,其特征在于,所述在所述分布式全文检索系统数据库中建立倒排索引,包括:
根据所述过车图片的文本描述信息的主要字段设置关键词索引,并以所述过车图片的文本描述信息的分布式全文检索系统数据的文档编号为索引内容建立倒排索引。
4.根据权利要求3所述的基于分布式全文检索系统的卡口车辆搜索的方法,其特征在于,所述根据所述目标卡口车辆属性从所述分布式全文检索系统数据库中查找到目标卡口车辆信息并进行反馈,包括:
根据所述目标卡口车辆属性设置索引;
基于该索引从所述分布式全文检索系统数据库中查找到相应的目标卡口车辆信息的文档编号;
再通过查找到的文档编号获取目标卡口车辆信息并进行反馈。
5.根据权利要求1-4中任一项所述的基于分布式全文检索系统的卡口车辆搜索的方法,其特征在于,所述分布式存储由至少两台物理机进行存储,并通过分布式服务框架管理各个存储节点。
6.一种基于分布式全文检索系统的卡口车辆搜索的系统,其特征在于,所述系统包括:获取模块、配置模块、存储模块、接收模块及处理模块,其中,
所述获取模块,用于获取由卡口的过车图片解析后生成的过车图片的文本描述信息,所述过车图片的文本描述信息至少包括:车牌号、车型、车身颜色、车牌颜色、卡口信息及过车时间,其中,所述过车图片的文本描述信息通过分布式发布订阅消息系统进行缓存;
所述配置模块,用于根据所述过车图片的文本描述信息的主要字段设置分布式全文检索系统配置文件;
所述存储模块,用于按所述分布式全文检索系统配置文件将所述过车图片的文本描述信息解析索引到分布式全文检索系统数据库中,在所述分布式全文检索系统数据库中建立倒排索引并进行分布式存储;
所述接收模块,用于接收卡口车辆搜索请求,并解析出所要搜索的目标卡口车辆属性;
所述处理模块,用于根据所述目标卡口车辆属性从所述分布式全文检索系统数据库中查找到目标卡口车辆信息并进行反馈。
7.根据权利要求6所述的基于分布式全文检索系统的卡口车辆搜索的系统,其特征在于,所述主要字段至少包括:车牌号、车型、车身颜色、车牌颜色。
8.根据权利要求6所述的基于分布式全文检索系统的卡口车辆搜索的系统,其特征在于,所述存储模块,用于根据所述过车图片的文本描述信息的主要字段设置关键词索引,并以所述过车图片的文本描述信息的分布式全文检索系统数据的文档编号为索引内容建立倒排索引。
9.根据权利要求8所述的基于分布式全文检索系统的卡口车辆搜索的系统,其特征在于,所述处理模块,用于:
根据所述目标卡口车辆属性设置索引;
基于该索引从所述分布式全文检索系统数据库中查找到相应的目标卡口车辆信息的文档编号;
再通过查找到的文档编号获取目标卡口车辆信息并进行反馈。
10.根据权利要求6-9中任一项所述的基于分布式全文检索系统的卡口车辆搜索的系统,其特征在于,所述分布式存储由至少两台物理机进行存储,并通过分布式服务框架管理各个存储节点。
CN201610274064.XA 2016-04-28 2016-04-28 基于分布式全文检索系统的卡口车辆搜索的方法及系统 Pending CN106021276A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610274064.XA CN106021276A (zh) 2016-04-28 2016-04-28 基于分布式全文检索系统的卡口车辆搜索的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610274064.XA CN106021276A (zh) 2016-04-28 2016-04-28 基于分布式全文检索系统的卡口车辆搜索的方法及系统

Publications (1)

Publication Number Publication Date
CN106021276A true CN106021276A (zh) 2016-10-12

Family

ID=57081074

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610274064.XA Pending CN106021276A (zh) 2016-04-28 2016-04-28 基于分布式全文检索系统的卡口车辆搜索的方法及系统

Country Status (1)

Country Link
CN (1) CN106021276A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106570079A (zh) * 2016-10-18 2017-04-19 电子科技大学 基于颜色索引平衡二叉树的相邻车辆的查询算法
CN106599153A (zh) * 2016-12-07 2017-04-26 河北中废通网络技术有限公司 一种基于多个数据源的废旧行业搜索系统以及其方法
CN107798142A (zh) * 2017-11-24 2018-03-13 泰华智慧产业集团股份有限公司 基于大数据分析隐匿车辆的方法及装置
CN107977421A (zh) * 2017-11-24 2018-05-01 泰华智慧产业集团股份有限公司 基于大数据进行套牌车分析的方法及装置
CN109064191A (zh) * 2018-07-16 2018-12-21 杭州骑轻尘信息技术有限公司 车源数据解析方法、装置及电子设备
CN110209853A (zh) * 2019-06-14 2019-09-06 重庆紫光华山智安科技有限公司 车辆的图片搜索方法、装置和设备
CN111078960A (zh) * 2019-12-20 2020-04-28 金现代信息产业股份有限公司 一种电力调度系统设备实时检索的实现方法及系统
CN112084215A (zh) * 2020-09-08 2020-12-15 中国平安财产保险股份有限公司 车辆信息查询方法、装置、计算机设备及存储介质
CN113361550A (zh) * 2020-03-04 2021-09-07 阿里巴巴集团控股有限公司 目标检测方法、模型训练方法、装置及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2363816A1 (en) * 2010-02-08 2011-09-07 NAVTEQ North America, LLC Destination search in a navigation system using a spatial index structure
CN104462236A (zh) * 2014-11-14 2015-03-25 浪潮(北京)电子信息产业有限公司 一种基于大数据的伴随车辆识别方法和装置
CN105426437A (zh) * 2015-11-05 2016-03-23 西安翔迅科技有限责任公司 一种基于HBase的智能交通领域卡口数据存储方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2363816A1 (en) * 2010-02-08 2011-09-07 NAVTEQ North America, LLC Destination search in a navigation system using a spatial index structure
CN104462236A (zh) * 2014-11-14 2015-03-25 浪潮(北京)电子信息产业有限公司 一种基于大数据的伴随车辆识别方法和装置
CN105426437A (zh) * 2015-11-05 2016-03-23 西安翔迅科技有限责任公司 一种基于HBase的智能交通领域卡口数据存储方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106570079A (zh) * 2016-10-18 2017-04-19 电子科技大学 基于颜色索引平衡二叉树的相邻车辆的查询算法
CN106599153A (zh) * 2016-12-07 2017-04-26 河北中废通网络技术有限公司 一种基于多个数据源的废旧行业搜索系统以及其方法
CN107798142A (zh) * 2017-11-24 2018-03-13 泰华智慧产业集团股份有限公司 基于大数据分析隐匿车辆的方法及装置
CN107977421A (zh) * 2017-11-24 2018-05-01 泰华智慧产业集团股份有限公司 基于大数据进行套牌车分析的方法及装置
CN109064191A (zh) * 2018-07-16 2018-12-21 杭州骑轻尘信息技术有限公司 车源数据解析方法、装置及电子设备
CN110209853A (zh) * 2019-06-14 2019-09-06 重庆紫光华山智安科技有限公司 车辆的图片搜索方法、装置和设备
CN111078960A (zh) * 2019-12-20 2020-04-28 金现代信息产业股份有限公司 一种电力调度系统设备实时检索的实现方法及系统
CN111078960B (zh) * 2019-12-20 2023-09-05 金现代信息产业股份有限公司 一种电力调度系统设备实时检索的实现方法及系统
CN113361550A (zh) * 2020-03-04 2021-09-07 阿里巴巴集团控股有限公司 目标检测方法、模型训练方法、装置及设备
CN112084215A (zh) * 2020-09-08 2020-12-15 中国平安财产保险股份有限公司 车辆信息查询方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN106021276A (zh) 基于分布式全文检索系统的卡口车辆搜索的方法及系统
Park et al. Web-based collaborative big data analytics on big data as a service platform
CN102043833B (zh) 一种基于查询词进行搜索的方法和搜索装置
US9165085B2 (en) System and method for publishing aggregated content on mobile devices
CN105243086B (zh) 一种车辆信息查询方法和装置
CN101276361B (zh) 一种显示相关关键词的方法及系统
CN106776567B (zh) 一种互联网大数据分析提取方法及系统
CN103164449A (zh) 一种搜索结果的展现方法与装置
CN110532309B (zh) 一种高校图书馆用户画像系统的生成方法
CN105741121B (zh) 一种基于条目引用的产品溯源信息的编写与存储方法
CN102164186A (zh) 一种实现云搜索服务的方法及系统
US20130159275A1 (en) Information searching system and method
TWI453608B (zh) System and method for managing a large number of multiple data
CN105868253A (zh) 数据导入、查询方法及装置
US20140337361A1 (en) User-specific feed generation system
CN110990057A (zh) 小程序子链信息的提取方法、装置、设备及介质
CN102073735A (zh) 搜索方法及搜索系统
Gonzalez et al. Net2vec: Deep learning for the network
CN102156749B (zh) 一种地图网站的自动搜索判别方法、系统及其分布式服务器系统
CN106326317A (zh) 数据处理方法及装置
CN105677745B (zh) 一种通用高效自助数据查询系统及实现方法
US9602575B2 (en) Monitoring social media for specific issues
CN105740251B (zh) 一种总线式整合不同内容源的方法和系统
KR20100071765A (ko) 온라인 망을 이용한 맞춤형 정보 제공 시스템 및 그 방법
CN101977251A (zh) 服务器端网址资源优化装置及其优化方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20161012

RJ01 Rejection of invention patent application after publication