CN111159182A - 地域资产数据智能搜索方法、装置及计算机可读存储介质 - Google Patents
地域资产数据智能搜索方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN111159182A CN111159182A CN201911313633.7A CN201911313633A CN111159182A CN 111159182 A CN111159182 A CN 111159182A CN 201911313633 A CN201911313633 A CN 201911313633A CN 111159182 A CN111159182 A CN 111159182A
- Authority
- CN
- China
- Prior art keywords
- asset data
- regional
- query instruction
- search
- region information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000002457 bidirectional effect Effects 0.000 claims abstract description 13
- 230000011218 segmentation Effects 0.000 claims description 14
- 230000008569 process Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 239000010117 shenhua Substances 0.000 description 4
- 230000003416 augmentation Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/221—Column-oriented storage; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Remote Sensing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种大数据技术,揭露了一种地域资产数据智能搜索方法,包括:a、获取不同省市的地域信息集和资产数据集,将所述地域信息集和资产数据集进行分类处理后以双向列表的形式存入数据库中;b、接收用户在预先构建的搜索引擎中输入的资产数据查询指令;c、若所述资产数据查询指令包含地域信息,对所述资产数据查询指令进行标记后向所述数据库进行查询,将查询结果返回给所述用户;d、若所述资产数据查询指令不包含地域信息,将含有地域的隐藏字段添加至所述资产数据查询指令后执行上述步骤c,将查询结果返回给所述用户。本发明还提出一种地域资产数据智能搜索装置以及一种计算机可读存储介质。本发明实现了地域资产数据的智能搜索。
Description
技术领域
本发明涉及大数据技术领域,尤其涉及一种地域资产数据智能搜索方法、装置及计算机可读存储介质。
背景技术
目前在市面系统或者小程序搜索界面中,往往只有一个搜索窗口。关系型数据库无法做到全文的智能搜索,使用粗粒度的搜索引擎会返回很多无用的信息到页面,若使用精度较高的分词器进行搜索,查询结果匹配度会非常高,但是这种分词器还存在一定的弊端,经常会出现无法匹配到结果的情况。当用户录入信息时,会被要求按格式录入省、市级地址信息,显得比较呆板,不灵活,体验感会下降。而若在录入或导入数据时,地址格式不正确,或者地址中缺失了省、市信息,又无法按省市归属地查询到对应在该归属地下的资产信息。
发明内容
本发明提供一种地域资产数据智能搜索方法、装置及计算机可读存储介质,其主要目的在于当用户进行进行地域资产数据搜索时,给用户呈现出精准的搜索结果。
为实现上述目的,本发明提供的一种地域资产数据智能搜索方法,包括:
a、获取不同省市的地域信息集和资产数据集,将所述地域信息集和资产数据集进行分类处理,并将分类处理后的所述地域信息集和资产数据集以双向列表的形式存入数据库中;
b、接收用户在预先构建的搜索引擎中输入的资产数据查询指令;
c、若所述资产数据查询指令包含地域信息,则对所述资产数据查询指令进行标记后向所述数据库进行查询,并将查询结果通过所述搜索引擎返回给所述用户,完成所述地域资产数据的搜索;
d、若所述资产数据查询指令不包含地域信息,则将含有地域的隐藏字段添加至所述资产数据查询指令后执行上述步骤c,并将查询结果通过所述搜索引擎返回给所述用户,完成所述地域资产数据的搜索。
可选地,所述获取不同省市的地域信息集和资产数据集,包括:
利用关键字搜索方法从网页中下载得到所述地域信息集和资产数据集;
通过访问不同省市的政府后台数据库获取得到所述地域信息集和资产数据集;其中,所述地域信息集包括区、县以及乡镇的地址,以及所述资产数据集包括企业数据、产业数据以及人才数据。
可选地,所述将所述地域信息集和资产数据集进行分类处理,包括:
预设存在地域信息的文本串S和资产数据的模式串P,在所述文本串S中内查找一个模式串P,当所述文本串S匹配到i位置,模式串P匹配到j位置时包括:
当j=-1时,或当前字符匹配成功(即S[i]==P[j]),令i++,j++,继续匹配下一个字符;
当j!=-1时且当前字符匹配失败(即S[i]!=P[j]),则令i不变,j=next[j],其表示字符匹配失败时,模式串P相对于文本串S向右移动了j-next[j]位。
可选地,所述对所述资产数据查询指令进行标记后向所述数据库进行查询,包括:
通过分词器对所述资产数据查询指令进行标记,得到一字一词形式的资产数据查询指令,利用短语匹配算法向数据库进行完全匹配查询。
可选地,所述短语匹配算法包括:
通过解析所述一字一词形式的资产数据查询指令中字符串后生成一个词条列表,搜索数据库中所有的词条,保留包含了所有搜索词条的文档,从而实现所述完全匹配查询。
此外,为实现上述目的,本发明还提供一种地域资产数据智能搜索装置,该装置包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的地域资产数据智能搜索程序,所述地域资产数据智能搜索程序被所述处理器执行时实现如下步骤:
a、获取不同省市的地域信息集和资产数据集,将所述地域信息集和资产数据集进行分类处理,并将分类处理后的所述地域信息集和资产数据集以双向列表的形式存入数据库中;
b、接收用户在预先构建的搜索引擎中输入的资产数据查询指令;
c、若所述资产数据查询指令包含地域信息,则对所述资产数据查询指令进行标记后向所述数据库进行查询,并将查询结果通过所述搜索引擎返回给所述用户,完成所述地域资产数据的搜索;
d、若所述资产数据查询指令不包含地域信息,则将含有地域的隐藏字段添加至所述资产数据查询指令后执行上述步骤c,并将查询结果通过所述搜索引擎返回给所述用户,完成所述地域资产数据的搜索。
可选地,所述获取不同省市的地域信息集和资产数据集,包括:
利用关键字搜索方法从网页中下载得到所述地域信息集和资产数据集;
通过访问不同省市的政府后台数据库获取得到所述地域信息集和资产数据集;其中,所述地域信息集包括区、县以及乡镇的地址,以及所述资产数据集包括企业数据、产业数据以及人才数据。
可选地,所述将所述地域信息集和资产数据集进行分类处理,包括:
预设存在地域信息的文本串S和资产数据的模式串P,在所述文本串S中内查找一个模式串P,当所述文本串S匹配到i位置,模式串P匹配到j位置时包括:
当j=-1时,或当前字符匹配成功(即S[i]==P[j]),令i++,j++,继续匹配下一个字符;
当j!=-1时且当前字符匹配失败(即S[i]!=P[j]),则令i不变,j=next[j],其表示字符匹配失败时,模式串P相对于文本串S向右移动了j-next[j]位。
可选地,所述对所述资产数据查询指令进行标记后向所述数据库进行查询,包括:
通过分词器对所述资产数据查询指令进行标记,得到一字一词形式的资产数据查询指令,利用短语匹配算法向数据库进行完全匹配查询。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有地域资产数据智能搜索程序,所述地域资产数据智能搜索程序可被一个或者多个处理器执行,以实现如上所述的地域资产数据智能搜索方法的步骤。
本发明提出的地域资产数据智能搜索方法、装置及计算机可读存储介质,在用户进行地域资产数据智能搜索时,获取不同省市的地域信息集和资产数据集,将所述地域信息集和资产数据集进行预处理后存入数据库中,接收用户在预先构建的搜索引擎中输入的包含地域信息和不包含地域信息的资产数据查询指令向数据库进行完全匹配查询,并将查询结果返回给所述用户,从而可以给用户呈现出精准的搜索结果。
附图说明
图1为本发明一实施例提供的地域资产数据智能搜索方法的流程示意图;
图2为本发明一实施例提供的地域资产数据智能搜索装置的内部结构示意图;
图3为本发明一实施例提供的地域资产数据智能搜索装置中地域资产数据智能搜索程序的模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种地域资产数据智能搜索方法。参照图1所示,为本发明一实施例提供的地域资产数据智能搜索方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,地域资产数据智能搜索方法包括:
S1、获取不同省市的地域信息集和资产数据集,将所述地域信息集和资产数据集进行分类处理,并将分类处理后的所述地域信息集和资产数据集以双向列表的形式存入数据库中。
本发明较佳实施例通过以下方式获取所述不同省市的地域信息集和资产数据集,方式一、利用关键字搜索方法从网页中下载得到;方式二、访问不同省市的政府后台数据库进行获取得到。其中,本发明中所述地域信息集包括区、县以及乡镇的地址。所述资产数据集包括企业数据、产业数据以及人才数据。进一步地,所述分类处理是将所述资产数据集和所述地域信息集按照一一对应的原则进行分类。
较佳地,本发明中通过字符串匹配算法(KMP)实现所述分类处理,详细的,所述KMP算法包括:预设存在地域信息的文本串S和资产数据的模式串P,在所述文本串S中内查找一个模式串P,当所述文本串S匹配到i位置,模式串P匹配到j位置时包括:当j=-1时,或当前字符匹配成功(即S[i]==P[j]),令i++,j++,继续匹配下一个字符;当j!=-1时,且当前字符匹配失败(即S[i]!=P[j]),则令i不变,j=next[j],其表示字符匹配失败时,模式串P相对于文本串S向右移动了j-next[j]位。即当匹配失败时,模式串向右移动的位数为=失败字符所在位置减去失败字符对应的next值,即移动的实际位数为:j-next[j],且此值大于等于1。其中,next数组各值的含义代表当前字符之前的字符串中,有多大长度的相同前缀后缀。例如,如果next[j]=k,代表j之前的字符串中有最大长度为k的相同前缀后缀,即某个字符失配时,该字符对应的next值会告诉你下一步匹配中,模式串应该跳到next[j]的位置。如果next[j]等于0或-1,则跳到模式串的开头字符,若next[j]=k且k>0,表示下次匹配跳到j之前的某个字符,且具体跳过了k个字符。
进一步地,本发明中所述双向列表指的是将所述地域信息集和资产数据集存储到不同数据表中,其中,所述双向列表的列名包括{地域ID,父类ID,地域名称,地区类型}和{资产ID,父类ID,资产名称,资产类型}。
S2、接收用户在预先构建的搜索引擎中输入的资产数据查询指令。
本发明较佳实施例中,所述预先构建的搜索引擎为Elasticsearch(ES)搜索引擎,所述ES搜索引擎是一个分布式、高扩展、高实时的搜索与数据分析引擎,能够很方便的使大量数据具有搜索、分析和探索的能力。所述输入的资产数据查询指令可以为查询某地域的企业数量,产业类型等,例如查询深圳市龙华地区的上市企业数量,深圳市龙华地区的产业类型。
S3、若所述资产数据查询指令包含地域信息,对所述资产数据查询指令进行标记后向所述数据库进行查询,并将查询结果通过所述搜索引擎返回给所述用户。
本发明较佳实施例中,若所述资产数据查询指令包含地域信息,例如查询深圳市龙华区的企业数量,通过分词器对所述资产数据查询指令进行标记,得到一字一词形式的资产数据查询指令,利用短语匹配算法向数据库进行完全匹配查询,并将查询结果通过所述搜索引擎返回给所述用户。其中,所述分词器为NGram分词器。所述短语匹配算法包括:通过解析所述一字一词形式的资产数据查询指令中字符串后生成一个词条列表,搜索数据库中所有的词条,保留包含了所有搜索词条的文档,从而实现所述完全匹配查询。其中,所述词条的位置为相互邻接状态。当所述搜索引擎没有查询到结果或者结果列表中没有其需要的查询结果时,本发明通过在搜索结果列表下方点击查询更多相似结果,进行第二次查询。当数据库收到第二次查询请求的时,通过修改分词器为默认的standard分词器,并对检索字段的范围进行增广操作,并再次向ES发送查询请求,从而完成地域资产数据的搜索。
S4、若所述资产数据查询指令不包含地域信息,将含有地域的隐藏字段添加至所述资产数据查询指令后执行上述步骤S3,并将查询结果通过所述搜索引擎返回给所述用户。
本发明较佳实施例中,若所述资产数据查询指令不包含地域信息,例如查询深圳市企业数量,不知道查询深圳市某个地域资产数据时,较佳地,本发明通过将含有深圳市所有地域的隐藏字段添加至所述资产数据查询指令后执行上述步骤S3,将得到的查询结果进行汇总后展示给所述用户,根据用户的需求对汇总后的查询结果进行删减操作,从而完成地域资产数据的搜索。
发明还提供一种地域资产数据智能搜索装置。参照图2所示,为本发明一实施例提供的地域资产数据智能搜索装置的内部结构示意图。
在本实施例中,所述地域资产数据智能搜索装置1可以是PC(Personal Computer,个人电脑),或者是智能手机、平板电脑、便携计算机等终端设备,也可以是一种服务器等。该地域资产数据智能搜索装置1至少包括存储器11、处理器12,通信总线13,以及网络接口14。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是地域资产数据智能搜索装置1的内部存储单元,例如该地域资产数据智能搜索装置1的硬盘。存储器11在另一些实施例中也可以是地域资产数据智能搜索装置1的外部存储设备,例如地域资产数据智能搜索装置1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器11还可以既包括地域资产数据智能搜索装置1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于地域资产数据智能搜索装置1的应用软件及各类数据,例如地域资产数据智能搜索程序01的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行地域资产数据智能搜索程序01等。
通信总线13用于实现这些组件之间的连接通信。
网络接口14可选的可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该装置1与其他电子设备之间建立通信连接。
可选地,该装置1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在地域资产数据智能搜索装置1中处理的信息以及用于显示可视化的用户界面。
图2仅示出了具有组件11-14以及地域资产数据智能搜索程序01的地域资产数据智能搜索装置1,本领域技术人员可以理解的是,图1示出的结构并不构成对地域资产数据智能搜索装置1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
在图2所示的装置1实施例中,存储器11中存储有地域资产数据智能搜索程序01;处理器12执行存储器11中存储的地域资产数据智能搜索程序01时实现如下步骤:
步骤一、获取不同省市的地域信息集和资产数据集,将所述地域信息集和资产数据集进行分类处理,并将分类处理后的所述地域信息集和资产数据集以双向列表的形式存入数据库中。
本发明较佳实施例通过以下三种方式获取所述不同省市的地域信息集和资产数据集,方式一、利用关键字搜索方法从网页中下载得到;方式二、访问不同省市的政府后台数据库进行获取得到。其中,本发明中所述地域信息集包括区、县以及乡镇的地址。所述资产数据集包括企业数据、产业数据以及人才数据。进一步地,所述分类处理是将所述资产数据集和所述地域信息集按照一一对应的原则进行分类。
较佳地,本发明中通过字符串匹配算法(KMP)实现所述分类处理,详细的,所述KMP算法包括:预设存在地域信息的文本串S和资产数据的模式串P,在所述文本串S中内查找一个模式串P,当所述文本串S匹配到i位置,模式串P匹配到j位置时包括:当j=-1时,或当前字符匹配成功(即S[i]==P[j]),令i++,j++,继续匹配下一个字符;当j!=-1时,且当前字符匹配失败(即S[i]!=P[j]),则令i不变,j=next[j],其表示字符匹配失败时,模式串P相对于文本串S向右移动了j-next[j]位。即当匹配失败时,模式串向右移动的位数为=失败字符所在位置减去失败字符对应的next值,即移动的实际位数为:j-next[j],且此值大于等于1。其中,next数组各值的含义代表当前字符之前的字符串中,有多大长度的相同前缀后缀。例如,如果next[j]=k,代表j之前的字符串中有最大长度为k的相同前缀后缀,即某个字符失配时,该字符对应的next值会告诉你下一步匹配中,模式串应该跳到next[j]的位置。如果next[j]等于0或-1,则跳到模式串的开头字符,若next[j]=k且k>0,表示下次匹配跳到j之前的某个字符,且具体跳过了k个字符。
进一步地,本发明中所述双向列表指的是将所述地域信息集和资产数据集存储到不同数据表中,其中,所述双向列表的列名包括{地域ID,父类ID,地域名称,地区类型}和{资产ID,父类ID,资产名称,资产类型}。
步骤二、接收用户在预先构建的搜索引擎中输入的资产数据查询指令。
本发明较佳实施例中,所述预先构建的搜索引擎为Elasticsearch(ES)搜索引擎,所述ES搜索引擎是一个分布式、高扩展、高实时的搜索与数据分析引擎,能够很方便的使大量数据具有搜索、分析和探索的能力。所述输入的资产数据查询指令可以为查询某地域的企业数量,产业类型等,例如查询深圳市龙华地区的上市企业数量,深圳市龙华地区的产业类型。
步骤三、若所述资产数据查询指令包含地域信息,对所述资产数据查询指令进行标记后向所述数据库进行查询,并将查询结果通过所述搜索引擎返回给所述用户。
本发明较佳实施例中,若所述资产数据查询指令包含地域信息,例如查询深圳市龙华区的企业数量,通过分词器对所述资产数据查询指令进行标记,得到一字一词形式的资产数据查询指令,利用短语匹配算法向数据库进行完全匹配查询,并将查询结果通过所述搜索引擎返回给所述用户。其中,所述分词器为NGram分词器。所述短语匹配算法包括:通过解析所述一字一词形式的资产数据查询指令中字符串后生成一个词条列表,搜索数据库中所有的词条,保留包含了所有搜索词条的文档,从而实现所述完全匹配查询。其中,所述词条的位置为相互邻接状态。当所述搜索引擎没有查询到结果或者结果列表中没有其需要的查询结果时,本发明通过在搜索结果列表下方点击查询更多相似结果,进行第二次查询。当数据库收到第二次查询请求的时,通过修改分词器为默认的standard分词器,并对检索字段的范围进行增广操作,并再次向ES发送查询请求,从而完成地域资产数据的搜索。
步骤四、若所述资产数据查询指令不包含地域信息,将含有地域的隐藏字段添加至所述资产数据查询指令后执行上述步骤S3,并将查询结果通过所述搜索引擎返回给所述用户。
本发明较佳实施例中,若所述资产数据查询指令不包含地域信息,例如查询深圳市企业数量,不知道查询深圳市某个地域资产数据时,较佳地,本发明通过将含有深圳市所有地域的隐藏字段添加至所述资产数据查询指令后执行上述步骤S3,将得到的查询结果进行汇总后展示给所述用户,根据用户的需求对汇总后的查询结果进行删减操作,从而完成地域资产数据的搜索。
可选地,在其他实施例中,地域资产数据智能搜索程序还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,用于描述地域资产数据智能搜索程序在地域资产数据智能搜索装置中的执行过程。
例如,参照图3所示,为本发明地域资产数据智能搜索装置一实施例中的地域资产数据智能搜索程序的程序模块示意图,该实施例中,所述地域资产数据智能搜索程序可以被分割为分类处理模块10、查询指令接收模块20以及搜索模块30,示例性地:
所述分类处理模块10用于:获取不同省市的地域信息集和资产数据集,将所述地域信息集和资产数据集进行分类处理,并将分类处理后的所述地域信息集和资产数据集以双向列表的形式存入数据库中。
所述查询指令接收模块20用于:接收用户在预先构建的搜索引擎中输入的资产数据查询指令。
所述搜索模块30用于:若所述资产数据查询指令包含地域信息,则对所述资产数据查询指令进行标记后向所述数据库进行查询,并将查询结果通过所述搜索引擎返回给所述用户;若所述资产数据查询指令不包含地域信息,则将含有地域的隐藏字段添加至所述资产数据查询指令后执行所述包含地域信息查询指令的操作步骤,并将查询结果通过所述搜索引擎返回给所述用户,完成所述地域资产数据的搜索。。
上述分类处理模块10、查询指令接收模块20以及搜索模块30等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同,在此不再赘述。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有地域资产数据智能搜索程序,所述地域资产数据智能搜索程序可被一个或多个处理器执行,以实现如下操作:
a、获取不同省市的地域信息集和资产数据集,将所述地域信息集和资产数据集进行分类处理,并将分类处理后的所述地域信息集和资产数据集以双向列表的形式存入数据库中;
b、接收用户在预先构建的搜索引擎中输入的资产数据查询指令;
c、若所述资产数据查询指令包含地域信息,则对所述资产数据查询指令进行标记后向所述数据库进行查询,并将查询结果通过所述搜索引擎返回给所述用户,完成所述地域资产数据的搜索;
d、若所述资产数据查询指令不包含地域信息,则将含有地域的隐藏字段添加至所述资产数据查询指令后执行上述步骤c,并将查询结果通过所述搜索引擎返回给所述用户,完成所述地域资产数据的搜索。
本发明计算机可读存储介质具体实施方式与上述地域资产数据智能搜索装置和方法各实施例基本相同,在此不作累述。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种地域资产数据智能搜索方法,其特征在于,所述方法包括:
a、获取不同省市的地域信息集和资产数据集,将所述地域信息集和资产数据集进行分类处理,并将分类处理后的所述地域信息集和资产数据集以双向列表的形式存入数据库中;
b、接收用户在预先构建的搜索引擎中输入的资产数据查询指令;
c、若所述资产数据查询指令包含地域信息,则对所述资产数据查询指令进行标记后向所述数据库进行查询,并将查询结果通过所述搜索引擎返回给所述用户,完成所述地域资产数据的搜索;
d、若所述资产数据查询指令不包含地域信息,则将含有地域的隐藏字段添加至所述资产数据查询指令后执行上述步骤c,并将查询结果通过所述搜索引擎返回给所述用户,完成所述地域资产数据的搜索。
2.如权利要求1所述的地域资产数据智能搜索方法,其特征在于,所述获取不同省市的地域信息集和资产数据集,包括:
利用关键字搜索方法从网页中下载得到所述地域信息集和资产数据集;
通过访问不同省市的政府后台数据库获取得到所述地域信息集和资产数据集;其中,所述地域信息集包括区、县以及乡镇的地址,以及所述资产数据集包括企业数据、产业数据以及人才数据。
3.如权利要求1所述的地域资产数据智能搜索方法,其特征在于,所述将所述地域信息集和资产数据集进行分类处理,包括:
预设存在地域信息的文本串S和资产数据的模式串P,在所述文本串S中内查找一个模式串P,当所述文本串S匹配到i位置,模式串P匹配到j位置时包括:
当j=-1时,或当前字符匹配成功(即S[i]==P[j]),令i++,j++,继续匹配下一个字符;
当j!=-1时且当前字符匹配失败(即S[i]!=P[j]),则令i不变,j=next[j],其表示字符匹配失败时,模式串P相对于文本串S向右移动了j-next[j]位。
4.如权利要求1至3中任意一项所述的地域资产数据智能搜索方法,其特征在于,所述对所述资产数据查询指令进行标记后向所述数据库进行查询,包括:
通过分词器对所述资产数据查询指令进行标记,得到一字一词形式的资产数据查询指令,利用短语匹配算法向数据库进行完全匹配查询。
5.如权利要求4所述的地域资产数据智能搜索方法,其特征在于,所述短语匹配算法包括:
通过解析所述一字一词形式的资产数据查询指令中字符串后生成一个词条列表,搜索数据库中所有的词条,保留包含了所有搜索词条的文档,从而实现所述完全匹配查询。
6.一种地域资产数据智能搜索装置,其特征在于,所述装置包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的地域资产数据智能搜索程序,所述地域资产数据智能搜索程序被所述处理器执行时实现如下步骤:
a、获取不同省市的地域信息集和资产数据集,将所述地域信息集和资产数据集进行分类处理,并将分类处理后的所述地域信息集和资产数据集以双向列表的形式存入数据库中;
b、接收用户在预先构建的搜索引擎中输入的资产数据查询指令;
c、若所述资产数据查询指令包含地域信息,则对所述资产数据查询指令进行标记后向所述数据库进行查询,并将查询结果通过所述搜索引擎返回给所述用户,完成所述地域资产数据的搜索;
d、若所述资产数据查询指令不包含地域信息,则将含有地域的隐藏字段添加至所述资产数据查询指令后执行上述步骤c,并将查询结果通过所述搜索引擎返回给所述用户,完成所述地域资产数据的搜索。
7.如权利要求6所述的地域资产数据智能搜索装置,其特征在于所述获取不同省市的地域信息集和资产数据集,包括:
利用关键字搜索方法从网页中下载得到所述地域信息集和资产数据集;
通过访问不同省市的政府后台数据库获取得到所述地域信息集和资产数据集;其中,所述地域信息集包括区、县以及乡镇的地址,以及所述资产数据集包括企业数据、产业数据以及人才数据。
8.如权利要求6所述的地域资产数据智能搜索装置,其特征在于,所述将所述地域信息集和资产数据集进行分类处理,包括:
预设存在地域信息的文本串S和资产数据的模式串P,在所述文本串S中内查找一个模式串P,当所述文本串S匹配到i位置,模式串P匹配到j位置时包括:
若j=-1,或当前字符匹配成功(即S[i]==P[j]),令i++,j++,继续匹配下一个字符;
若j!=-1,且当前字符匹配失败(即S[i]!=P[j]),则令i不变,j=next[j],其表示字符匹配失败时,模式串P相对于文本串S向右移动了j-next[j]位。
9.如权利要求6至8中任意一项所述的地域资产数据智能搜索装置,其特征在于,所述对所述资产数据查询指令进行标记后向所述数据库进行查询,包括:
通过分词器对所述资产数据查询指令进行标记,得到一字一词形式的资产数据查询指令,利用短语匹配算法向数据库进行完全匹配查询。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有地域资产数据智能搜索程序,所述地域资产数据智能搜索程序可被一个或者多个处理器执行,以实现如权利要求1至5中任一项所述的地域资产数据智能搜索方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911313633.7A CN111159182A (zh) | 2019-12-18 | 2019-12-18 | 地域资产数据智能搜索方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911313633.7A CN111159182A (zh) | 2019-12-18 | 2019-12-18 | 地域资产数据智能搜索方法、装置及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111159182A true CN111159182A (zh) | 2020-05-15 |
Family
ID=70557255
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911313633.7A Pending CN111159182A (zh) | 2019-12-18 | 2019-12-18 | 地域资产数据智能搜索方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111159182A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113706060A (zh) * | 2021-10-29 | 2021-11-26 | 中国电力科学研究院有限公司 | 电网调控数据资产处理方法、系统、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106256114A (zh) * | 2014-04-25 | 2016-12-21 | 谷歌公司 | 用于提供个性化便携式资产应用的系统和方法 |
CN109214667A (zh) * | 2018-08-24 | 2019-01-15 | 深圳量子防务在线科技有限公司 | 一种创新服务平台 |
CN110457346A (zh) * | 2019-07-05 | 2019-11-15 | 中国平安财产保险股份有限公司 | 数据查询方法、装置及计算机可读存储介质 |
-
2019
- 2019-12-18 CN CN201911313633.7A patent/CN111159182A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106256114A (zh) * | 2014-04-25 | 2016-12-21 | 谷歌公司 | 用于提供个性化便携式资产应用的系统和方法 |
CN109214667A (zh) * | 2018-08-24 | 2019-01-15 | 深圳量子防务在线科技有限公司 | 一种创新服务平台 |
CN110457346A (zh) * | 2019-07-05 | 2019-11-15 | 中国平安财产保险股份有限公司 | 数据查询方法、装置及计算机可读存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113706060A (zh) * | 2021-10-29 | 2021-11-26 | 中国电力科学研究院有限公司 | 电网调控数据资产处理方法、系统、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110457363B (zh) | 基于分布式数据库的查询方法、装置及存储介质 | |
CN108712519B (zh) | Ip地址的定位方法、装置及存储介质 | |
CN108804516B (zh) | 相似用户查找装置、方法及计算机可读存储介质 | |
US9262512B2 (en) | Providing search suggestions from user selected data sources for an input string | |
CN110457346B (zh) | 数据查询方法、装置及计算机可读存储介质 | |
CN102426591A (zh) | 一种操作用于内容输入的语料库的方法和设备 | |
US9639627B2 (en) | Method to search a task-based web interaction | |
US20110231386A1 (en) | Indexing and searching employing virtual documents | |
CN110738049B (zh) | 相似文本的处理方法、装置及计算机可读存储介质 | |
CN110765761A (zh) | 基于人工智能的合同敏感词校验方法、装置及存储介质 | |
CN109299235B (zh) | 知识库搜索方法、装置及计算机可读存储介质 | |
US10810181B2 (en) | Refining structured data indexes | |
CN111552704A (zh) | 一种数据报表生成方法、装置、计算机设备及存储介质 | |
CN105637509A (zh) | 在图像内搜索和注释 | |
CN110674087A (zh) | 文件查询方法、装置及计算机可读存储介质 | |
CN110866018A (zh) | 一种基于标签及标识解析的汽摩行业数据录入及检索方法 | |
CN103365876B (zh) | 基于关系图谱生成网络操作辅助信息的方法与设备 | |
KR20170073693A (ko) | 유사 그룹 요소 추출 | |
CN115145871A (zh) | 文件查询方法、装置和电子设备 | |
CN103294506A (zh) | 确定目标应用的多个版本应用所对应优先级的方法与设备 | |
US11409814B2 (en) | Systems and methods for crawling web pages and parsing relevant information stored in web pages | |
KR20160069402A (ko) | 이용자 반응형 웹페이지 제공 방법 | |
CN111159182A (zh) | 地域资产数据智能搜索方法、装置及计算机可读存储介质 | |
CN105005619A (zh) | 一种海量网站基础信息的快速检索方法和系统 | |
CN103064839A (zh) | 一种Pdf全文在线检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200515 |
|
WD01 | Invention patent application deemed withdrawn after publication |