CN111651458A - 一种市场监管数据检索方法、装置、设备及可读存储介质 - Google Patents

一种市场监管数据检索方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN111651458A
CN111651458A CN202010500162.7A CN202010500162A CN111651458A CN 111651458 A CN111651458 A CN 111651458A CN 202010500162 A CN202010500162 A CN 202010500162A CN 111651458 A CN111651458 A CN 111651458A
Authority
CN
China
Prior art keywords
target
data
keyword
market supervision
supervision
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010500162.7A
Other languages
English (en)
Inventor
董巨阳
王世峰
彭长青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CVIC Software Engineering Co Ltd
Original Assignee
CVIC Software Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CVIC Software Engineering Co Ltd filed Critical CVIC Software Engineering Co Ltd
Priority to CN202010500162.7A priority Critical patent/CN111651458A/zh
Publication of CN111651458A publication Critical patent/CN111651458A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2468Fuzzy queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Automation & Control Theory (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种市场监管数据检索方法,该方法包括以下步骤:接收待检索的目标市场监管关键词;将目标市场监管关键词输入到利用倒排索引算法建立的大数据SQL引擎数据模型中;利用大数据SQL引擎数据模型对目标市场监管关键词进行检索操作,得到目标市场监管数据。应用本发明实施例所提供的技术方案,通过对目标市场监管关键词进行倒排索引的方式进行数据检索,较大地提升了数据检索速度,提升了数据检索效果。本发明还公开了一种市场监管数据检索装置、设备及存储介质,具有相应技术效果。

Description

一种市场监管数据检索方法、装置、设备及可读存储介质
技术领域
本发明涉及数据挖掘技术领域,特别是涉及一种市场监管数据检索方法、装置、设备及计算机可读存储介质。
背景技术
随着数据挖掘技术的发展,其涉及众多科学技术,包括全文检索、机器学习、信息科学、数据可视化等其他科学。数据挖掘技术是目前处理大数据信息的主要手段之一,数据挖掘技术是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的,又是潜在有用的信息和知识的过程,是一种更深层次的数据分析。其中,市场监管业务中市场主体的监管离不开大数据的支撑,随着市场监管的数量规模、数据范围和数据量越来越大,建立市场监管全文检索成为提高市场监管水平有效支撑,即对各种数据进行收集、分析、整合和搜索使用。
现有的市场监管数据检索方式主要是基于传统的关系型数据库进行构建支撑。传统的关系型数据库数据检索查询的速度在大量数据的情况下很慢。另外检索效果比较差,只能对用户输入的完整关键字首尾位进行模糊匹配,用户搜索的结果误多输入一个字符,可能就导致查询出的结果远离用户的预期。
综上所述,如何有效地解决现有的市场监管数据检索方式数据检索速度慢,检索效果差等问题,是目前本领域技术人员急需解决的问题。
发明内容
本发明的目的是提供一种市场监管数据检索方法,该方法较大地提升了数据检索速度,提升了数据检索效果;本发明的另一目的是提供一种市场监管数据检索装置、设备及计算机可读存储介质。
为解决上述技术问题,本发明提供如下技术方案:
一种市场监管数据检索方法,包括:
接收待检索的目标市场监管关键词;
将所述目标市场监管关键词输入到利用倒排索引算法建立的大数据SQL引擎数据模型中;
利用所述大数据SQL引擎数据模型对所述目标市场监管关键词进行检索操作,得到目标市场监管数据。
在本发明的一种具体实施方式中,在接收待检索的目标市场监管关键词之后,将所述目标市场监管关键词输入到利用倒排索引算法建立的大数据SQL引擎数据模型中之前,还包括:
对所述目标市场监管关键词进行解析,得到所述目标市场监管关键词所属的目标语言类型;
判断所述目标语言类型是否为所述大数据SQL引擎数据模型可识别的预设语言类型;
若否,则将所述目标市场监管关键词由所述目标语言类型转化为所述预设语言类型。
在本发明的一种具体实施方式中,利用所述大数据SQL引擎数据模型对所述目标市场监管关键词进行检索操作,得到目标市场监管数据,包括:
获取所述目标市场监管关键词对应的目标数据类型信息;
从所述大数据SQL引擎数据模型中查找所述目标数据类型信息对应的目标倒排索引表;其中,所述大数据SQL引擎数据模型预部署有各数据类型信息与各倒排索引表之间的对应关系;
利用目标倒排索引表对所述目标市场监管关键词进行检索操作,得到所述目标市场监管数据。
在本发明的一种具体实施方式中,利用目标倒排索引表对所述目标市场监管关键词进行检索操作,得到所述目标市场监管数据,包括:
读取所述目标市场监管关键词对应的目标词标识信息;
从所述目标倒排索引表中查找所述目标词标识信息对应的目标文档标识信息;
根据所述标文档标识信息进行数据检索,得到所述目标市场监管数据。
一种市场监管数据检索装置,包括:
关键词接收模块,用于接收待检索的目标市场监管关键词;
关键词输入模块,用于将所述目标市场监管关键词输入到利用倒排索引算法建立的大数据SQL引擎数据模型中;
数据检索模块,用于利用所述大数据SQL引擎数据模型对所述目标市场监管关键词进行检索操作,得到目标市场监管数据。
在本发明的一种具体实施方式中,还包括:
语言类型获取模块,用于在接收待检索的目标市场监管关键词之后,将所述目标市场监管关键词输入到利用倒排索引算法建立的大数据SQL引擎数据模型中之前,对所述目标市场监管关键词进行解析,得到所述目标市场监管关键词所属的目标语言类型;
判断模块,用于判断所述目标语言类型是否为所述大数据SQL引擎数据模型可识别的预设语言类型;
语言类型转化模块,用于当确定所述目标语言类型不是所述大数据SQL引擎数据模型可识别的预设语言类型时,将所述目标市场监管关键词由所述目标语言类型转化为所述预设语言类型。
在本发明的一种具体实施方式中,所述数据检索模块包括:
类型信息获取子模块,用于获取所述目标市场监管关键词对应的目标数据类型信息;
索引表查找子模块,用于从所述大数据SQL引擎数据模型中查找所述目标数据类型信息对应的目标倒排索引表;其中,所述大数据SQL引擎数据模型预部署有各数据类型信息与各倒排索引表之间的对应关系;
数据检索子模块,用于利用目标倒排索引表对所述目标市场监管关键词进行检索操作,得到所述目标市场监管数据。
在本发明的一种具体实施方式中,所述数据检索子模块包括:
词标识信息读取单元,用于读取所述目标市场监管关键词对应的目标词标识信息;
文档标识信息查找单元,用于从所述目标倒排索引表中查找所述目标词标识信息对应的目标文档标识信息;
数据检索单元,用于根据所述标文档标识信息进行数据检索,得到所述目标市场监管数据。
一种市场监管数据检索设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如前所述市场监管数据检索方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前所述市场监管数据检索方法的步骤。
应用本发明实施例所提供的方法,接收待检索的目标市场监管关键词;将目标市场监管关键词输入到利用倒排索引算法建立的大数据SQL引擎数据模型中;利用大数据SQL引擎数据模型对目标市场监管关键词进行检索操作,得到目标市场监管数据。通过利用倒排索引算法建立的大数据SQL引擎数据模型,通过对目标市场监管关键词进行倒排索引的方式进行数据检索,较大地提升了数据检索速度,提升了数据检索效果。
相应的,本发明实施例还提供了与上述市场监管数据检索方法相对应的市场监管数据检索装置、设备和计算机可读存储介质,具有上述技术效果,在此不再赘述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中市场监管数据检索方法的一种实施流程图;
图2为本发明实施例中市场监管数据检索方法的另一种实施流程图;
图3为本发明实施例中一种市场监管数据检索装置的结构框图;
图4为本发明实施例中一种市场监管数据检索设备的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
参见图1,图1为本发明实施例中市场监管数据检索方法的一种实施流程图,该方法可以包括以下步骤:
S101:接收待检索的目标市场监管关键词。
当需要对目标市场监管数据进行检索时,向市场监管数据检索中心发送与目标市场监管数据相关的目标市场监管关键词,市场监管数据检索中心接收待检索的目标市场监管关键词。目标市场监管数据可以为市场主体、人员、设备、产品、标准、舆情等数据。如当需要对关于记载加油站油品情况的文档进行检索时,可以将油品作为目标市场监管关键词进行搜索。
S102:将目标市场监管关键词输入到利用倒排索引算法建立的大数据SQL引擎数据模型中。
明确市场监管大数据分布式全文检索的建设目标和效果预期,基于大数据SQL引擎组织数据,如可以采取网络爬虫技术组织数据,预先利用倒排索引算法建立大数据结构化查询语言(SQL,Structured Query Language)引擎数据模型。在接收到待检索的目标市场监管关键词之后,将目标市场监管关键词输入到利用倒排索引算法建立的大数据SQL引擎数据模型中。
倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为倒排索引(inverted index)。在本发明实施例中是以需要索引的目标市场监管数据的属性值对目标市场监管数据进行索引。
S103:利用大数据SQL引擎数据模型对目标市场监管关键词进行检索操作,得到目标市场监管数据。
在将目标市场监管关键词输入到利用倒排索引算法建立的大数据SQL引擎数据模型中之后,利用大数据SQL引擎数据模型对目标市场监管关键词进行检索操作,得到目标市场监管数据。通过利用倒排索引算法建立的大数据SQL引擎数据模型进行数据检索,实现快速检索市场监管有价值的关联信息,借助大数据、人工智能等先进技术,有效挖掘数据的价值,为市场监管提供可靠的数据支撑。
应用本发明实施例所提供的方法,接收待检索的目标市场监管关键词;将目标市场监管关键词输入到利用倒排索引算法建立的大数据SQL引擎数据模型中;利用大数据SQL引擎数据模型对目标市场监管关键词进行检索操作,得到目标市场监管数据。通过利用倒排索引算法建立的大数据SQL引擎数据模型,通过对目标市场监管关键词进行倒排索引的方式进行数据检索,较大地提升了数据检索速度,提升了数据检索效果。
需要说明的是,基于上述实施例一,本发明实施例还提供了相应的改进方案。在后续实施例中涉及与上述实施例一中相同步骤或相应步骤之间可相互参考,相应的有益效果也可相互参照,在下文的改进实施例中不再一一赘述。
实施例二:
参见图2,图2为本发明实施例中市场监管数据检索方法的另一种实施流程图,该方法可以包括以下步骤:
S201:接收待检索的目标市场监管关键词。
S202:对目标市场监管关键词进行解析,得到目标市场监管关键词所属的目标语言类型。
在接收到待检索的目标市场监管关键词之后,对目标市场监管关键词进行解析,得到目标市场监管关键词所属的目标语言类型。
S203:判断目标语言类型是否为大数据SQL引擎数据模型可识别的预设语言类型,若否,则执行步骤S204,若是,则不做处理。
预先设置大数据SQL引擎数据模型可识别的语言类型,如结构化查询语言文法,在解析得到目标市场监管关键词所属的目标语言类型之后,判断目标语言类型是否为大数据SQL引擎数据模型可识别的预设语言类型,若是,则说明输入的目标市场监管关键词所属的目标语言类型能够被大数据SQL引擎数据模型识别,不需要做任何处理;若否,则说明目标市场监管关键词所属的目标语言类型不能够被大数据SQL引擎数据模型识别,可以继续执行步骤S204。
S204:将目标市场监管关键词由目标语言类型转化为预设语言类型。
当确定目标市场监管关键词所属的目标语言类型不是大数据SQL引擎数据模型可识别的预设语言类型时,将目标市场监管关键词由目标语言类型转化为预设语言类型。如可以通过预先设置统一语言转换协议,利用统一语言转换协议将获取到的与预设语言类型不一致的目标语言类型的目标市场监管关键词转化为预设语言类型的目标市场监管关键词。
S205:将目标市场监管关键词输入到利用倒排索引算法建立的大数据SQL引擎数据模型中。
S206:获取目标市场监管关键词对应的目标数据类型信息。
在接收到待检索的目标市场监管关键词之后,获取目标市场监管关键词对应的目标数据类型信息。如舆情类信息、产品类信息等。
S207:从大数据SQL引擎数据模型中查找目标数据类型信息对应的目标倒排索引表。
其中,大数据SQL引擎数据模型预部署有各数据类型信息与各倒排索引表之间的对应关系。
大数据SQL引擎数据模型中预先部署有各数据类型信息与各倒排索引表之间的对应关系。在获取到目标市场监管关键词对应的目标数据类型信息之后,从大数据SQL引擎数据模型中查找目标数据类型信息对应的目标倒排索引表。
S208:读取目标市场监管关键词对应的目标词标识信息。
目标市场监管关键词携带有自身对应的目标词标识信息,读取目标市场监管关键词对应的目标词标识信息。
S209:从目标倒排索引表中查找目标词标识信息对应的目标文档标识信息。
目标倒排索引表中存储有各词标识信息与各文档标识信息之间的对应关系。在读取到目标市场监管关键词对应的目标词标识信息之后,从目标倒排索引表中查找目标词标识信息对应的目标文档标识信息。
S210:根据标文档标识信息进行数据检索,得到目标市场监管数据。
在从目标倒排索引表中查找到目标词标识信息对应的目标文档标识信息之后,根据标文档标识信息进行数据检索,得到目标市场监管数据。并且设置检索任务的并行化,包括索引构建和检索的并行化,进一步对市场监管数据的检索速度。可以从市场主体、检验检测、特种设备安全监察、标准、企业官网信息、网络舆情信息等所有数据信息建立分布式全文检索应用,从而快速、直观地反映出一个市场主体的综合情况。并且全文检索应用形成对外提供精确检索、通配符检索、模糊检索、分词检索、全文检索等一网搜应用。
索引相当于传统关系型数据库的一个数据库,可以按照市场监管的需求设计市场主体、产品、人员、设备等多个索引,然后在索引下建立类型(相当于传统关系型数据库的一个表),索引可以定义一个或者多个类型,文档必须属于一个类型,是通过绘制地图mapping文件定义。mapping文件中可以包括字段名(即市场监管关键词名称)、字段数据类型(即市场监管关键词名称对应的数据类型)和字段索引类型(即市场监管数据对应的数据类型)这3个方面的定义,需要定义多种类型,在定义类型时,需要通过mapping文件定义各个字段的类型,处理方式(如切词、过滤等),然后所有文档将基于这个mapping文件来构建倒排索引,一个类型对应一个倒排索引表。文档作为可以被索引的基本数据单位,也是全文搜索中被搜索的对象,可以对应一个网页,一篇txt文档或者一个产品。在市场监管实际的索引构建过程中,对数据库中原始的数据结构,创建新的倒排索引结构的数据区域。用户有查询需求时,先访问倒排索引数据区域,得出文档标识信息后,通过文档id快速准确地找到具体的文档内容。
在一种具体实例应用中,对加油站舆情数据进行检索的过程可以通过表1和表2来呈现,表1存储有各文档标识信息与各文档内容之间的对应关系,表2为表1对应的倒排索引设计。
表1
Figure BDA0002524495260000081
Figure BDA0002524495260000091
表2
词标识信息 市场监管关键词 倒排列表文档标识信息
1 Xx加油站 1,2,3
2 油品 1,3
3 油枪 2
4 整改 3
5 投诉 1,3
6 ……
相应于上面的方法实施例,本发明实施例还提供了一种市场监管数据检索装置,下文描述的市场监管数据检索装置与上文描述的市场监管数据检索方法可相互对应参照。
参见图3,图3为本发明实施例中一种市场监管数据检索装置的结构框图,该装置可以包括:
关键词接收模块31,用于接收待检索的目标市场监管关键词;
关键词输入模块32,用于将目标市场监管关键词输入到利用倒排索引算法建立的大数据SQL引擎数据模型中;
数据检索模块33,用于利用大数据SQL引擎数据模型对目标市场监管关键词进行检索操作,得到目标市场监管数据。
应用本发明实施例所提供的装置,接收待检索的目标市场监管关键词;将目标市场监管关键词输入到利用倒排索引算法建立的大数据SQL引擎数据模型中;利用大数据SQL引擎数据模型对目标市场监管关键词进行检索操作,得到目标市场监管数据。通过利用倒排索引算法建立的大数据SQL引擎数据模型,通过对目标市场监管关键词进行倒排索引的方式进行数据检索,较大地提升了数据检索速度,提升了数据检索效果。
在本发明的一种具体实施方式中,该装置还可以包括:
语言类型获取模块,用于在接收待检索的目标市场监管关键词之后,将目标市场监管关键词输入到利用倒排索引算法建立的大数据SQL引擎数据模型中之前,对目标市场监管关键词进行解析,得到目标市场监管关键词所属的目标语言类型;
判断模块,用于判断目标语言类型是否为大数据SQL引擎数据模型可识别的预设语言类型;
语言类型转化模块,用于当确定目标语言类型不是大数据SQL引擎数据模型可识别的预设语言类型时,将目标市场监管关键词由目标语言类型转化为预设语言类型。
在本发明的一种具体实施方式中,数据检索模块33包括:
类型信息获取子模块,用于获取目标市场监管关键词对应的目标数据类型信息;
索引表查找子模块,用于从大数据SQL引擎数据模型中查找目标数据类型信息对应的目标倒排索引表;其中,大数据SQL引擎数据模型预部署有各数据类型信息与各倒排索引表之间的对应关系;
数据检索子模块,用于利用目标倒排索引表对目标市场监管关键词进行检索操作,得到目标市场监管数据。
在本发明的一种具体实施方式中,数据检索子模块包括:
词标识信息读取单元,用于读取目标市场监管关键词对应的目标词标识信息;
文档标识信息查找单元,用于从目标倒排索引表中查找目标词标识信息对应的目标文档标识信息;
数据检索单元,用于根据标文档标识信息进行数据检索,得到目标市场监管数据。
相应于上面的方法实施例,参见图4,图4为本发明所提供的市场监管数据检索设备的示意图,该设备可以包括:
存储器41,用于存储计算机程序;
处理器42,用于执行上述存储器41存储的计算机程序时可实现如下步骤:
接收待检索的目标市场监管关键词;将目标市场监管关键词输入到利用倒排索引算法建立的大数据SQL引擎数据模型中;利用大数据SQL引擎数据模型对目标市场监管关键词进行检索操作,得到目标市场监管数据。
对于本发明提供的设备的介绍请参照上述方法实施例,本发明在此不做赘述。
相应于上面的方法实施例,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时可实现如下步骤:
接收待检索的目标市场监管关键词;将目标市场监管关键词输入到利用倒排索引算法建立的大数据SQL引擎数据模型中;利用大数据SQL引擎数据模型对目标市场监管关键词进行检索操作,得到目标市场监管数据。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
对于本发明提供的计算机可读存储介质的介绍请参照上述方法实施例,本发明在此不做赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置、设备及计算机可读存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的技术方案及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种市场监管数据检索方法,其特征在于,包括:
接收待检索的目标市场监管关键词;
将所述目标市场监管关键词输入到利用倒排索引算法建立的大数据SQL引擎数据模型中;
利用所述大数据SQL引擎数据模型对所述目标市场监管关键词进行检索操作,得到目标市场监管数据。
2.根据权利要求1所述的市场监管数据检索方法,其特征在于,在接收待检索的目标市场监管关键词之后,将所述目标市场监管关键词输入到利用倒排索引算法建立的大数据SQL引擎数据模型中之前,还包括:
对所述目标市场监管关键词进行解析,得到所述目标市场监管关键词所属的目标语言类型;
判断所述目标语言类型是否为所述大数据SQL引擎数据模型可识别的预设语言类型;
若否,则将所述目标市场监管关键词由所述目标语言类型转化为所述预设语言类型。
3.根据权利要求1或2所述的市场监管数据检索方法,其特征在于,利用所述大数据SQL引擎数据模型对所述目标市场监管关键词进行检索操作,得到目标市场监管数据,包括:
获取所述目标市场监管关键词对应的目标数据类型信息;
从所述大数据SQL引擎数据模型中查找所述目标数据类型信息对应的目标倒排索引表;其中,所述大数据SQL引擎数据模型预部署有各数据类型信息与各倒排索引表之间的对应关系;
利用目标倒排索引表对所述目标市场监管关键词进行检索操作,得到所述目标市场监管数据。
4.根据权利要求3所述的市场监管数据检索方法,其特征在于,利用目标倒排索引表对所述目标市场监管关键词进行检索操作,得到所述目标市场监管数据,包括:
读取所述目标市场监管关键词对应的目标词标识信息;
从所述目标倒排索引表中查找所述目标词标识信息对应的目标文档标识信息;
根据所述标文档标识信息进行数据检索,得到所述目标市场监管数据。
5.一种市场监管数据检索装置,其特征在于,包括:
关键词接收模块,用于接收待检索的目标市场监管关键词;
关键词输入模块,用于将所述目标市场监管关键词输入到利用倒排索引算法建立的大数据SQL引擎数据模型中;
数据检索模块,用于利用所述大数据SQL引擎数据模型对所述目标市场监管关键词进行检索操作,得到目标市场监管数据。
6.根据权利要求5所述的市场监管数据检索装置,其特征在于,还包括:
语言类型获取模块,用于在接收待检索的目标市场监管关键词之后,将所述目标市场监管关键词输入到利用倒排索引算法建立的大数据SQL引擎数据模型中之前,对所述目标市场监管关键词进行解析,得到所述目标市场监管关键词所属的目标语言类型;
判断模块,用于判断所述目标语言类型是否为所述大数据SQL引擎数据模型可识别的预设语言类型;
语言类型转化模块,用于当确定所述目标语言类型不是所述大数据SQL引擎数据模型可识别的预设语言类型时,将所述目标市场监管关键词由所述目标语言类型转化为所述预设语言类型。
7.根据权利要求5或6所述的市场监管数据检索装置,其特征在于,所述数据检索模块包括:
类型信息获取子模块,用于获取所述目标市场监管关键词对应的目标数据类型信息;
索引表查找子模块,用于从所述大数据SQL引擎数据模型中查找所述目标数据类型信息对应的目标倒排索引表;其中,所述大数据SQL引擎数据模型预部署有各数据类型信息与各倒排索引表之间的对应关系;
数据检索子模块,用于利用目标倒排索引表对所述目标市场监管关键词进行检索操作,得到所述目标市场监管数据。
8.根据权利要求7所述的市场监管数据检索装置,其特征在于,所述数据检索子模块包括:
词标识信息读取单元,用于读取所述目标市场监管关键词对应的目标词标识信息;
文档标识信息查找单元,用于从所述目标倒排索引表中查找所述目标词标识信息对应的目标文档标识信息;
数据检索单元,用于根据所述标文档标识信息进行数据检索,得到所述目标市场监管数据。
9.一种市场监管数据检索设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至4任一项所述市场监管数据检索方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述市场监管数据检索方法的步骤。
CN202010500162.7A 2020-06-04 2020-06-04 一种市场监管数据检索方法、装置、设备及可读存储介质 Pending CN111651458A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010500162.7A CN111651458A (zh) 2020-06-04 2020-06-04 一种市场监管数据检索方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010500162.7A CN111651458A (zh) 2020-06-04 2020-06-04 一种市场监管数据检索方法、装置、设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN111651458A true CN111651458A (zh) 2020-09-11

Family

ID=72351239

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010500162.7A Pending CN111651458A (zh) 2020-06-04 2020-06-04 一种市场监管数据检索方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN111651458A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102024047A (zh) * 2010-12-14 2011-04-20 青岛普加智能信息有限公司 数据检索方法及装置
CN104679778A (zh) * 2013-11-29 2015-06-03 腾讯科技(深圳)有限公司 一种搜索结果的生成方法及装置
CN108446323A (zh) * 2018-02-11 2018-08-24 山东省农业信息中心 一种基于全文搜索引擎的数据检索方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102024047A (zh) * 2010-12-14 2011-04-20 青岛普加智能信息有限公司 数据检索方法及装置
CN104679778A (zh) * 2013-11-29 2015-06-03 腾讯科技(深圳)有限公司 一种搜索结果的生成方法及装置
CN108446323A (zh) * 2018-02-11 2018-08-24 山东省农业信息中心 一种基于全文搜索引擎的数据检索方法及装置

Similar Documents

Publication Publication Date Title
CN108804521B (zh) 一种基于知识图谱的问答方法及农业百科问答系统
CN110399457B (zh) 一种智能问答方法和系统
US10146862B2 (en) Context-based metadata generation and automatic annotation of electronic media in a computer network
US9183286B2 (en) Methodologies and analytics tools for identifying white space opportunities in a given industry
CN108280114B (zh) 一种基于深度学习的用户文献阅读兴趣分析方法
US8560531B2 (en) Search tool that utilizes scientific metadata matched against user-entered parameters
CN109271477A (zh) 一种借助互联网构建分类语料库的方法及系统
US20100131485A1 (en) Method and system for automatic construction of information organization structure for related information browsing
KR101505858B1 (ko) 대용량 데이터를 용이하게 분석하기 위하여 테이블 관계 및 참조의 템플릿을 검색하여 제공하는 템플릿 기반 온라인 분석보고서 작성 지원 시스템
CN105868177A (zh) 一种通用公式搜索方法
CN111125086A (zh) 获取数据资源的方法、装置、存储介质及处理器
KR102345410B1 (ko) 빅데이터 지능형 수집 방법 및 장치
CN112149422A (zh) 一种基于自然语言的企业新闻动态监测方法
KR101753768B1 (ko) 가중치에 의한 다수 분야별 검색 기능을 구비한 지식관리 시스템
CN107943937B (zh) 一种基于司法公开信息分析的债务人资产监控方法及系统
Wu et al. Searching online book documents and analyzing book citations
Ritze Web-scale web table to knowledge base matching
CN112711716A (zh) 一种基于知识图谱的海洋产业新闻推送方法及系统
CN112214615A (zh) 基于知识图谱的政策文件处理方法、装置和存储介质
CN115953041A (zh) 一种营商政策系统的构建方案及系统
CN111651458A (zh) 一种市场监管数据检索方法、装置、设备及可读存储介质
Manguinhas et al. A geo-temporal web gazetteer integrating data from multiple sources
CN112131215B (zh) 自底向上的数据库信息获取方法及装置
CN112818005A (zh) 结构化数据的搜索方法、装置、设备及存储介质
Liu et al. Research on key issues of data integration technology in electric power system in big data environment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200911