WO2019169858A1 - 一种基于搜索引擎技术的数据分析方法及系统 - Google Patents

一种基于搜索引擎技术的数据分析方法及系统 Download PDF

Info

Publication number
WO2019169858A1
WO2019169858A1 PCT/CN2018/108769 CN2018108769W WO2019169858A1 WO 2019169858 A1 WO2019169858 A1 WO 2019169858A1 CN 2018108769 W CN2018108769 W CN 2018108769W WO 2019169858 A1 WO2019169858 A1 WO 2019169858A1
Authority
WO
WIPO (PCT)
Prior art keywords
data analysis
search
user
keyword
vocabulary
Prior art date
Application number
PCT/CN2018/108769
Other languages
English (en)
French (fr)
Inventor
刘冶
林志远
彭楠
张允聪
印鉴
Original Assignee
广州赫炎大数据科技有限公司
刘冶
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 广州赫炎大数据科技有限公司, 刘冶 filed Critical 广州赫炎大数据科技有限公司
Publication of WO2019169858A1 publication Critical patent/WO2019169858A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Definitions

  • the invention relates to the field of data analysis, in particular to a data analysis method and system based on search engine technology.
  • the data analysis system can calculate various analysis indicators and transform them into information forms that are easily accepted by people, because they enable users to quickly and clearly read business data and operate related projects. Providing data support with decision making, therefore, is gaining favor from more and more users.
  • the current data analysis system usually provides various data analysis function entries through the module, and the user clicks the function entry to execute the data analysis instruction as needed.
  • This traditional modular data analysis system is weaker in quickly and accurately locating target data.
  • the data analysis system exhibits multi-source heterogeneous characteristics, and new users need to spend a lot of time and energy reading the instruction documentation in order to skillfully use the data analysis system; on the other hand, even if they are already skilled in operating the data analysis system.
  • Users due to the multi-level modularity of data analysis system functions, users often need to go through many cumbersome operations to get the desired results.
  • the object of the present invention is to provide a data analysis method based on search engine technology, which has the function of not requiring the user to click and operate each function module multiple times, and does not require the user to be familiar with the complicated reading instructions, and only needs the user to input a search sentence. It can obtain matching data analysis resources, with low operation threshold and convenient operation.
  • a data analysis method based on search engine technology comprising the following steps:
  • a set of data analysis results is generated and displayed based on the matched data analysis resource set.
  • the user of the present invention only needs to input a search sentence to obtain a matched data analysis resource, without requiring the user to click and operate each function module multiple times, and the user is not familiar with the complicated reading instructions, and the operation threshold is low.
  • the operation is convenient and fast.
  • the acquiring the keyword set according to the search statement includes: inputting the search sentence into the trained keyword acquisition model, and parsing the keyword set according to the corpus and using the keyword acquisition model.
  • the training establishment mode of the keyword acquisition model is established by inputting a large number of search sentences, performing recognition of the verb-object statement, and training after analysing the word sense.
  • the method further includes: acquiring a last word in the search sentence, and calling a data analysis resource index vocabulary to obtain a complement matching the word in the data analysis resource index vocabulary. a complete vocabulary collection, and displaying the complete vocabulary set in a drop-down box of the search bar; the completion vocabulary set is displayed in the order of: the number of consecutive matching words in the number of the last word of the search sentence, Display each vocabulary less in order.
  • the method further includes: determining whether the search statement includes an error-prone vocabulary, and if the error-prone vocabulary is included, calling the data analysis resource index vocabulary to replace the error-prone vocabulary with a keyword vocabulary And at the bottom of the search bar, the search term after the error-prone word is replaced with the keyword sink.
  • the search sentence input by the user is complemented and corrected, and the matching completion and correct vocabulary are dynamically displayed in the drop-down box of the search bar, so that the user can quickly and intelligently input the keywords that are easy to search. Improve the accuracy of subsequent keyword searches.
  • the method further includes: determining whether each keyword in the keyword set matches the corresponding data analysis resource, and if yes, analyzing the resource set and the set matching according to the data.
  • the parameter generates and displays a data analysis result set; otherwise, the unmatched keywords in the keyword set are obtained to form an unmatched keyword set, and the unmatched keyword set is retrieved to determine whether there is a matching parameter, if any Matching the parameter, generating and displaying a data analysis result set according to the data matching instruction set and the matching parameter; if there is no matching parameter, generating and displaying the data analysis result set according to the data matching instruction set and the set matching parameter.
  • Combining data analysis resources and matching parameters to generate data analysis results improves the accuracy of data analysis results.
  • the identity information of the user is also acquired, and the user identifier is generated according to the identity information of the user.
  • the method further includes: determining, according to the user identifier, whether the user has the right to execute the data analysis resource set, and if the data analysis resource set is not authorized to execute, generating and displaying the data analysis A link to a collection of resources; if there is permission to execute the collection of data analysis resources, a collection of data analysis results is generated and displayed.
  • the method further includes: counting the user search history according to the user identifier and the user search statement, and displaying the generated user popular search sentence; the statistical user search history, including: the user identifier The character is bound to the user search statement and stored in the user search log, and the user generates a popular search sentence; when the user has no input and clicks the search bar, the user's popular search sentence is displayed in the drop-down box of the search bar.
  • the method further includes: mapping the user-defined search statement to the user-specified data analysis resource, and acquiring the matching specified data when the user inputs the customized search statement. Analyze resource collections to generate and display data analysis results.
  • the user's popular search sentences and custom-designated data analysis resources are displayed to achieve personalized recommendation and positioning, thereby making the operation more convenient.
  • the present invention also provides a data analysis system based on search engine technology, comprising a processor adapted to implement instructions; and a memory adapted to store a plurality of instructions adapted to be loaded and executed by the processor:
  • a set of data analysis results is generated and displayed based on the matched data analysis resource set.
  • the present invention also provides a computer readable storage medium having stored thereon a computer program, the computer program being executed by a processor to implement the steps of the data analysis method based on the search engine technology according to any of the above.
  • the user of the present invention only needs to input a search sentence to obtain a matched data analysis resource, without requiring the user to click and operate each function module multiple times, and the user is not familiar with the complicated reading instructions, and the operation threshold is low.
  • the operation is convenient and fast.
  • FIG. 1 is a flowchart of a data analysis method based on search engine technology according to an embodiment of the present invention.
  • FIG. 1 is a flowchart of a data analysis method based on search engine technology according to an embodiment of the present invention.
  • the data analysis method based on search engine technology includes the following steps:
  • Step S1 Acquire a search sentence input by the user.
  • the method further includes: acquiring the last word in the search sentence, and calling the data analysis resource index vocabulary to obtain the word in the data analysis resource index vocabulary Matching the complete vocabulary set, and displaying the complete vocabulary set in the drop-down box of the search bar; the complete vocabulary set is displayed in the order of: the number of consecutive matching words in the forward number of the last word of the search sentence, The complete vocabulary is displayed in order from the most to the least.
  • the search statement includes a plurality of search words sequentially input
  • the obtaining a search sentence input by the user includes: acquiring each search word input by the user in real time, and calling the data analysis resource index vocabulary in real time. Obtaining a complete vocabulary set matching the search word in the data analysis resource index vocabulary, and dynamically displaying the matched vocabulary set in the drop-down box of the search bar, so that the user can quickly input the key to facilitate the search. Words to improve the accuracy of subsequent search keywords.
  • the method further includes: determining whether the search statement includes an error-prone vocabulary, and if the error-prone vocabulary is included, calling the data analysis resource index vocabulary to replace the error-prone vocabulary For the keyword sink, and below the search bar, the search term after the error-prone word is replaced with the keyword sink.
  • the identity information of the user is also acquired, and the user identifier is generated according to the identity information of the user.
  • the manner of obtaining the identity information of the user may be identified by the user logging in to the search engine technology-based data analysis system of the present application, and the user login mode may include password recognition, face recognition, fingerprint recognition, iris recognition, and vein recognition.
  • Step S2 Acquire a keyword set according to the search sentence.
  • the obtaining the keyword set according to the search statement includes: inputting the search sentence into the trained keyword acquisition model, and parsing the keyword set from the search sentence according to the corpus and acquiring the model by using the keyword; wherein
  • the training establishment method of the keyword acquisition model is: by inputting a large number of search sentences in the keyword acquisition module, and performing the recognition of the verb-object statement and the recognition and recognition of the word meaning, the search sentence used in the training is the data analysis resource index vocabulary. A collection of index words in .
  • the corpus is equivalent to a natural language library, and a reserved vocabulary can be added to the corpus to dynamically modify the corpus; the search sentence can be queried in the corpus, and the search term query expressed by the natural language that the user may use is corresponding to the data analysis. Keywords in the resource index lexicon.
  • Step S3 Acquire a matching data analysis resource set according to the keyword set.
  • the data analysis resource set includes: a data analysis chart, a real-time big data cloud map, an underlying data self-query data drawing board, and a data analysis related description document.
  • data analysis resources such as data analysis chart, real-time big data cloud chart, and underlying data self-query data drawing board are obtained by reading the data analysis resource configuration file and supplementing the index of the corresponding web page to obtain the above three data analysis.
  • the index word of the resource; for the data analysis related description document, the index word of the data analysis related description document is established by extracting the data analysis to explain the keywords in the document.
  • each keyword of the keyword set is matched with each index word of the data analysis resource index vocabulary to obtain data analysis resources corresponding to each index word, and then each The data analysis resources are spliced to form a data analysis resource set.
  • one keyword can be matched to multiple data analysis resources, and multiple keywords can be matched to multiple data analysis resources, and the intersection of these keywords is obtained to obtain a data analysis resource set, such as the data matched by the keyword A.
  • Step S4 Analyze the resource set according to the matched data, and generate and display the data analysis result set.
  • the method before the generating and displaying the data analysis result set, the method further includes: determining, according to the user identifier, whether the user has the right to execute the data analysis resource set, and if the data analysis resource set is not authorized to execute, generating the A link to display the collection of data analysis resources. If there is permission to execute the data analysis resource set, the data analysis result is generated and displayed.
  • the method before the generating and displaying the data analysis result set, the method further includes: determining whether each keyword in the keyword set matches the corresponding data analysis resource, and if yes, analyzing the resource set and the setting according to the data.
  • the matching matching parameter generates and displays the data analysis result set; otherwise, the unmatched keywords in the keyword set are obtained, and an unmatched keyword set is formed, and the unmatched keyword set is retrieved to determine whether there is a matching parameter. If there is a matching parameter, generating and displaying a data analysis result set according to the data matching instruction set and the matching parameter; if there is no matching parameter, generating and displaying the data analysis result according to the data matching instruction set and the set matching parameter set.
  • the data analysis result generation process further selects a result with a matching parameter in a result generated by the data analysis instruction set, and then displays a data analysis result having the matching parameter.
  • the data analysis result may configure the display weights of the relevant instruction sets in the background, and the weights are preferentially displayed, otherwise they are displayed in the order of default reading.
  • the matching parameters include time parameters, geographic parameters, and the like.
  • the time parameter in the unmatched keyword set when identifying the time parameter in the unmatched keyword set, it is first determined whether the keyword can be converted into a normal date parameter by using the check function, and if so, the converted date parameter is used as the time parameter. If not, look at the custom time text collection to see if there is a matching text. If it exists, the corresponding keyword is the time parameter.
  • the practice of other parameters can also be identified as described above.
  • the user query statement is “new user added to the game platform in Guangzhou in the past month”, and the keyword set corresponding to the query includes “nearly one month”, “Guangzhou area”, “game platform” and “new user”. "; Among them, according to the "game platform” and “new user” matching index to the "game platform new users” data analysis resource collection; and the unmatched "near month” and "Guangzhou area” form an unmatched In the unmatched keyword set, by further searching to determine whether there is a keyword matching the preset time, region and other parameter types, in this example, the time in the unmatched keyword set is identified.
  • the result display column below the search bar shows the data statistics of the newly added users of the game platform in Guangzhou in the past month.
  • the method further includes: counting the user search history according to the user identifier and the user search sentence, and displaying the generated user popular search sentence.
  • the statistical user search history includes: binding the user identifier and the user search statement to the user search log, and generating a user popular search sentence; and when the user has no input and clicks the search bar, in the drop-down box of the search bar. Displays the user's popular search statement.
  • the method further includes: mapping the user-defined search statement to the user-specified data analysis resource, and acquiring when the user inputs the customized search statement. Matches the specified set of data analysis resources, and then generates and displays the data analysis results.
  • the present invention also provides a data analysis system based on search engine technology, comprising a processor adapted to implement instructions; and a memory adapted to store a plurality of instructions adapted to be loaded and executed by the processor: obtaining user input a search statement; acquiring a keyword set according to the search sentence; obtaining a matched data analysis resource set according to the keyword set; analyzing and analyzing the resource set according to the matched data, generating and displaying the data analysis result set.
  • the processor further loads and executes: acquiring the last word in the search sentence, and calling the data analysis resource index vocabulary to analyze the data in the data. Obtaining a complete vocabulary set matching the word in the index vocabulary, and displaying the complete vocabulary set in a drop-down box of the search bar; the completion vocabulary set is displayed in the order of: and the last word of the search sentence The number of consecutive matching words of the number, in order to display the respective vocabulary in order.
  • the search statement includes a plurality of search words sequentially input, and when the processor acquires a search sentence input by a user, the processor further loads and executes: acquiring each search word input by the user in real time. And real-time calling the data analysis resource index vocabulary to obtain a complete vocabulary set matching the search word in the data analysis resource index vocabulary, and dynamically displaying the matched vocabulary set in the drop-down box of the search bar.
  • the accuracy of subsequent search keywords is improved.
  • the processor after the processor acquires a search statement input by a user, the processor further loads and executes: determining whether the search statement includes an error-prone vocabulary, and if the error-prone vocabulary is included, invoking a data analysis resource index
  • the thesaurus replaces the error-prone words with keyword sinks, and displays the search terms after the error-prone words are replaced by the keyword sinks below the search bar.
  • the processor before the processor obtains a search statement input by the user, the processor further loads and executes: acquiring identity information of the user, and generating a user identifier according to the identity information of the user.
  • the manner of obtaining the identity information of the user may be identified by the user logging in to the search engine technology-based data analysis system of the present application, and the user login mode may include password recognition, face recognition, fingerprint recognition, iris recognition, and vein recognition.
  • the obtaining the keyword set according to the search statement includes: inputting the search sentence into the trained keyword acquisition model, and parsing the keyword set from the search sentence according to the corpus and acquiring the model by using the keyword; wherein
  • the training establishment method of the keyword acquisition model is: by inputting a large number of search sentences in the keyword acquisition module, and performing the recognition of the verb-object statement and the recognition and recognition of the word meaning, the search sentence used in the training is the data analysis resource index vocabulary. A collection of index words in .
  • the corpus is equivalent to a natural language library, and a reserved vocabulary can be added to the corpus to dynamically modify the corpus; the search sentence can be queried in the corpus, and the search term query expressed by the natural language that the user may use is corresponding to the data analysis. Keywords in the resource index lexicon.
  • the data analysis resource set includes: a data analysis chart, a real-time big data cloud chart, an underlying data self-query data drawing board, and a data analysis related description document.
  • data analysis resources such as data analysis chart, real-time big data cloud chart, and underlying data self-query data drawing board are obtained by reading the data analysis resource configuration file and supplementing the index of the corresponding web page to obtain the above three data analysis.
  • the index word of the resource; for the data analysis related description document, the index word of the data analysis related description document is established by extracting the data analysis to explain the keywords in the document.
  • each keyword of the keyword set is matched with each index word of the data analysis resource index vocabulary to obtain data analysis resources corresponding to each index word, and then each The data analysis resources are spliced to form a data analysis resource set.
  • one keyword can be matched to multiple data analysis resources, and multiple keywords can be matched to multiple data analysis resources, and the intersection of these keywords is obtained to obtain a data analysis resource set, such as the data matched by the keyword A.
  • the processor before the processor generates and displays the data analysis result set, the processor further loads and executes: determining, according to the user identifier, whether the user has the right to execute the data analysis resource set, if the permission is not performed
  • the data analysis resource collection generates and displays a link to the data analysis resource collection. If there is permission to execute the data analysis resource set, the data analysis result is generated and displayed, such as a visual data analysis chart.
  • the processor before the processor generates the data analysis result set, the processor further loads and executes: determining whether each keyword in the keyword set matches a corresponding data analysis resource, and if so, according to the The data analysis resource set and the set matching parameter generate and display the data analysis result set; otherwise, the unmatched keywords in the keyword set are obtained, and an unmatched keyword set is formed, and in the unmatched keyword set Searching to determine whether there is a matching parameter, if there is a matching parameter, generating and displaying a data analysis result set according to the data matching instruction set and the matching parameter; if there is no matching parameter, matching the instruction set and the set matching parameter according to the data Generate and display a collection of data analysis results.
  • the data analysis result generation process further selects a result with a matching parameter in a result generated by the data analysis instruction set, and then displays a data analysis result having the matching parameter.
  • the data analysis result may configure the display weights of the relevant instruction sets in the background, and the weights are preferentially displayed, otherwise they are displayed in the order of default reading.
  • the matching parameters include time parameters, geographic parameters, and the like.
  • the time parameter in the unmatched keyword set when identifying the time parameter in the unmatched keyword set, it is first determined whether the keyword can be converted into a normal date parameter by using the check function, and if so, the converted date parameter is used as the time parameter. If not, look at the custom time text collection to see if there is a matching text. If it exists, the corresponding keyword is the time parameter.
  • the practice of other parameters can also be identified as described above.
  • the user query statement is “new user added to the game platform in Guangzhou in the past month”, and the keyword set corresponding to the query includes “nearly one month”, “Guangzhou area”, “game platform” and “new user”. "; Among them, according to the "game platform” and “new user” matching index to the "game platform new users” data analysis resource collection; and the unmatched "near month” and "Guangzhou area” form an unmatched In the unmatched keyword set, by further searching to determine whether there is a keyword matching the preset time, region and other parameter types, in this example, the time in the unmatched keyword set is identified.
  • the result display column below the search bar shows the data statistics of the newly added users of the game platform in Guangzhou in the past month.
  • the processor further loads and executes: counting the user search history according to the user identifier and the user search sentence, and displaying the generated user popular search sentence.
  • the statistical user search history includes: binding the user identifier and the user search statement to the user search log, and generating a user popular search sentence; and when the user has no input and clicks the search bar, in the drop-down box of the search bar. Displays the user's popular search statement.
  • the processor after the processor generates and displays the data analysis result set, the processor further loads and executes: mapping the user-defined search statement to the user-specified data analysis resource, and inputting the user input.
  • mapping the user-defined search statement to the user-specified data analysis resource, and inputting the user input.
  • the user of the present invention only needs to input a search sentence to obtain a matched data analysis resource, without requiring the user to click and operate each function module multiple times, and the user is not familiar with the complicated reading instructions, and the operation threshold is low.
  • the operation is convenient and fast.
  • the keyword can be quickly and accurately obtained from the search sentence input by the user, so as to accurately locate the data analysis resource; the data analysis resource index lexicon is used to complete and correct the search sentence input by the user. And dynamically display matching completion and correct vocabulary in the drop-down box of the search bar, so that the user can quickly and intelligently input keywords that are easy to search, improve the accuracy of subsequent keyword retrieval; combine data analysis resources and matching parameters to generate data.
  • the analysis results improve the accuracy of data analysis results.
  • the user's popular search sentences and custom-designated data analysis resources are displayed to achieve personalized recommendation and positioning, thereby making the operation more convenient.
  • the present invention also provides a computer readable storage medium having stored thereon a computer program, the computer program being executed by a processor to implement the steps of the data analysis method based on the search engine technology according to any of the above.
  • the present invention can take the form of a computer program product embodied on one or more storage media (including but not limited to disk storage, CD-ROM, optical storage, etc.) in which program code is embodied.
  • Computer readable storage media includes both permanent and non-permanent, removable and non-removable media, and information storage can be implemented by any method or technology.
  • the information can be computer readable instructions, data structures, modules of programs, or other data. Examples of computer storage media include, but are not limited to, phase change memory (PRAM), static random access memory (SRAM), dynamic random access memory (DRAM), other types of random access memory (RAM), read only memory.
  • PRAM phase change memory
  • SRAM static random access memory
  • DRAM dynamic random access memory
  • RAM random access memory
  • ROM read only memory
  • EEPROM electrically erasable programmable read only memory
  • flash memory or other memory technology
  • compact disk read only memory CD-ROM
  • DVD digital versatile disk
  • Magnetic tape cartridges magnetic tape storage or other magnetic storage devices or any other non-transportable media can be used to store information that can be accessed by a computing device.

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于搜索引擎技术的数据分析方法及系统,包括如下步骤:获取用户输入的搜索语句;根据搜索语句获取关键词集合;根据该关键词集合获取匹配的数据分析资源集合;根据匹配的数据分析资源集合,生成并显示数据分析结果集合。相比于现有技术,本发明用户只需要输入搜索语句,即可获取相匹配的数据分析资源,无需用户多次点击操作各个功能模块,也无需用户熟悉阅读复杂的使用说明,操作门槛低,操作方便快捷。

Description

一种基于搜索引擎技术的数据分析方法及系统 技术领域
本发明涉及数据分析领域,特别是涉及一种基于搜索引擎技术的数据分析方法及系统。
背景技术
数据分析系统通过对数据信息进行加工和整理,可计算得到各种分析指标,转变为易于被人们所接受的信息形式,因其能够让用户快速、明晰地读取业务数据,为相关项目的运营与决策提供数据支撑,因此,获得越来越多用户的青睐。
目前的数据分析系统,通常是通过模块提供各项数据分析功能入口,用户根据需要点击功能入口执行数据分析指令。然而,随着互联网和人工智能的发展,数据处理技术及功能日趋多样化,这种传统模块化的数据分析系统在快速准确定位目标数据上越显乏力。一方面,数据分析系统呈现出多源异构的特性,新用户需要耗费大量的时间与精力阅读使用说明文档,才能熟练地运用数据分析系统;另一方面,即使是已经熟练操作数据分析系统的用户,由于数据分析系统功能的多层级模块化,用户通常需要通过多次繁琐的操作才能获得所需结果。
发明内容
基于此,本发明的目的在于,提供一种基于搜索引擎技术的数据分析方法,其具有无需用户多次点击操作各个功能模块,也无需用户熟悉阅读复杂的使用说明,只需要用户输入搜索语句即可获取相匹配的数据分析资源,操作门槛低,操作方便快捷。
一种基于搜索引擎技术的数据分析方法,包括如下步骤:
获取用户输入的搜索语句;
根据搜索语句获取关键词集合;
根据该关键词集合获取匹配的数据分析资源集合;
根据匹配的数据分析资源集合,生成并显示数据分析结果集合。
相比于现有技术,本发明用户只需要输入搜索语句,即可获取相匹配的数据分析资源,无需用户多次点击操作各个功能模块,也无需用户熟悉阅读复杂的使用说明,操作门槛低,操作方便快捷。
进一步地,所述根据搜索语句获取关键词集合,包括:将搜索语句输入已训练的关键词获取模型,根据语料库并通过该关键词获取模型解析出关键词集合。其中,所述关键词获取模型的训练建立方式为:通过输入大量的搜索语句,并进行动宾语句的识别以及词义解析识 别的训练后建立。通过关键词获取模型,可从用户输入的搜索语句中快速准确地获取关键词,实现精准定位数据分析资源。
进一步地,所述获取用户输入的搜索语句之后,还包括:获取搜索语句中的最后一个字,并调用数据分析资源索引词库,以在数据分析资源索引词库中获取与该字匹配的补全词汇集合,并在搜索栏的下拉框处显示该补全词汇集合;所述补全词汇集合的显示顺序为:以与搜索语句最后一个字往前数的连续匹配字数的多少,由多到少依序显示各个补全词汇。
进一步地,所述获取用户输入的搜索语句之后,还包括:判断所述搜索语句是否包含易错词汇,若包含易错词汇,则调用数据分析资源索引词库,将易错词汇替换为关键词汇,且在搜索栏下方显示易错词汇替换为关键词汇后的搜索语句。
通过数据分析资源索引词库,对用户输入的搜索语句进行补全和纠正,并在搜索栏的下拉框处动态显示匹配的补全和纠正词汇,可使用户快速智能输入便于搜索的关键词,提高后续关键词检索的准确性。
进一步地,所述生成并显示数据分析结果集合之前,还包括:判断关键词集合中的各关键词是否均匹配有对应的数据分析资源,若是,则根据该数据分析资源集合和设定的匹配参数生成并显示数据分析结果集合;否则,获取关键词集合内未匹配的关键词,以形成未匹配的关键词集合,并在该未匹配的关键词集合中检索判断是否存在匹配参数,若存在匹配参数,则根据该数据匹配指令集合和该匹配参数生成并显示数据分析结果集合;若不存在匹配参数,则根据该数据匹配指令集合和设定的匹配参数生成并显示数据分析结果集合。结合数据分析资源和匹配参数来生成数据分析结果,提高了数据分析结果获取的准确性。
进一步地,在所述获取用户输入的搜索语句之前,还获取用户的身份信息,并根据用户的身份信息生成用户标识符。
进一步地,所述执行该数据分析资源集合之前,还包括:根据用户标识符,判断用户是否有权限执行该数据分析资源集合,若无权限执行该数据分析资源集合,则生成并显示该数据分析资源集合的链接;若有权限执行该数据分析资源集合,则生成并显示数据分析结果集合。
进一步地,所述生成并显示数据分析结果集合之后,还包括:根据用户标识符和用户搜索语句统计用户搜索历史,并显示生成用户热门搜索语句;所述统计用户搜索历史,包括:将用户标识符与用户搜索语句绑定存储至用户搜索日志,并统计生成用户热门搜索语句;在用户无输入并点击搜索栏时,在搜索栏的下拉框处显示该用户的热门搜索语句。
进一步地,所述生成并显示数据分析结果集合之后,还包括:将用户自定义的搜索语句与用户指定的数据分析资源相映射存储,在用户输入自定义的搜索语句时,获取匹配指定的 数据分析资源集合,以生成并显示数据分析结果。
通过统计用户搜索历史和自定义搜索语句,以显示用户热门搜索语句和自定义指定的数据分析资源,进而实现个性化的推荐和定位,从而使操作更加便捷。
本发明还同时提供一种基于搜索引擎技术的数据分析系统,包括处理器,适于实现各指令;以及存储器,适于存储多条指令,所述指令适于由处理器加载并执行:
获取用户输入的搜索语句;
根据搜索语句获取关键词集合;
根据该关键词集合获取匹配的数据分析资源集合;
根据匹配的数据分析资源集合,生成并显示数据分析结果集合。
本发明还提供一种计算机可读存储介质,其上储存有计算机程序,该计算机程序被处理器执行时实现如上述任意一项所述的基于搜索引擎技术的数据分析方法的步骤。
相比于现有技术,本发明用户只需要输入搜索语句,即可获取相匹配的数据分析资源,无需用户多次点击操作各个功能模块,也无需用户熟悉阅读复杂的使用说明,操作门槛低,操作方便快捷。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1为本发明实施例中基于搜索引擎技术的数据分析方法的流程图。
具体实施方式
请参阅图1,其为本发明实施例中基于搜索引擎技术的数据分析方法的流程图。该基于搜索引擎技术的数据分析方法,包括如下步骤:
步骤S1:获取用户输入的搜索语句。
在一个实施例中,所述获取用户输入的搜索语句之后,还包括:获取搜索语句中的最后一个字,并调用数据分析资源索引词库,以在数据分析资源索引词库中获取与该字匹配的补全词汇集合,并在搜索栏的下拉框处显示该补全词汇集合;所述补全词汇集合的显示顺序为:以与搜索语句最后一个字往前数的连续匹配字数的多少,由多到少依序显示各个补全词汇。
在一个实施例中,所述搜索语句包括多个依序输入的搜索字,所述获取用户输入的搜索语句,包括:实时获取用户输入的每个搜索字,并实时调用数据分析资源索引词库,以在数据分析资源索引词库中获取与该搜索字匹配的补全词汇集合,并在搜索栏的下拉框处动态显示该匹配的补全词汇集合,以使用户快速智能输入便于搜索的关键词,提高后续检索关键词 的准确性。
在一个实施例中,所述获取用户输入的搜索语句之后,还包括:判断所述搜索语句是否包含易错词汇,若包含易错词汇,则调用数据分析资源索引词库,将易错词汇替换为关键词汇,且在搜索栏下方显示易错词汇替换为关键词汇后的搜索语句。
在一个实施例中,在所述获取用户输入的搜索语句之前,还获取用户的身份信息,并根据用户的身份信息生成用户标识符。其中,获取用户的身份信息的方式可通过用户登录本申请的基于搜索引擎技术的数据分析系统来识别,而用户登录方式可包括口令识别、人脸识别、指纹识别、虹膜识别和静脉识别等。
步骤S2:根据搜索语句获取关键词集合。
所述根据搜索语句获取关键词集合,包括:将搜索语句输入已训练好的关键词获取模型,根据语料库并通过该关键词获取模型可从该搜索语句中解析出关键词集合;其中,所述关键词获取模型的训练建立方式为:通过在关键词获取模块中输入大量的搜索语句,并进行动宾语句的识别以及词义解析识别后建立,训练时采用的搜索语句为数据分析资源索引词库中的索引词集合。
所述语料库相当于自然语言库,可往语料库中添加保留词汇,动态修改语料库;将搜索语句在所述语料库中进行查询,可将用户所可能采用的自然语言表达的搜索词查询对应到数据分析资源索引词库中的关键词。
步骤S3:根据该关键词集合获取匹配的数据分析资源集合。
所述数据分析资源集合包括:数据分析图表、实时大数据云图、底层数据自助查询数据画板和数据分析相关说明文档等。其中,对于数据分析图表、实时大数据云图、底层数据自助查询数据画板这类数据分析资源,通过读取数据分析资源的配置文件,辅以爬取对应web页面的指标,获取上述三种数据分析资源的索引词;对于数据分析相关说明文档,通过提取数据分析说明文档中的关键词,建立数据分析相关说明文档的索引词。
本实施例中,通过调用数据分析资源索引词库,将关键词集合的各个关键词与数据分析资源索引词库的各索引词进行匹配,以获取各索引词对应的数据分析资源,进而将各个数据分析资源拼接形成数据分析资源集合。其中,一个关键词可匹配到多个数据分析资源,多个关键词就可以匹配到多个数据分析资源,通过获取这些关键词的交集进而获取数据分析资源集合,如关键词A匹配到的数据分析资源为S1和S2;关键词B匹配到的数据分析资源为S2,则拼接后形成的数据分析资源即为A∩B=S2。
步骤S4:根据匹配的数据分析资源集合,生成并显示数据分析结果集合。
在一个实施例中,所述生成并显示数据分析结果集合之前,还包括:根据用户标识符, 判断用户是否有权限执行该数据分析资源集合,若无权限执行该数据分析资源集合,则生成并显示该数据分析资源集合的链接。若有权限执行该数据分析资源集合则生成并显示数据分析结果。
在一个实施例中,所述生成并显示数据分析结果集合之前,还包括:判断关键词集合中的各关键词是否均匹配有对应的数据分析资源,若是,则根据该数据分析资源集合和设定的匹配参数生成并显示数据分析结果集合;否则,获取关键词集合内未匹配的关键词,并形成未匹配的关键词集合,并在该未匹配的关键词集合中检索判断是否存在匹配参数,若存在匹配参数,则根据该数据匹配指令集合和该匹配参数生成并显示数据分析结果集合;若不存在匹配参数,则根据该数据匹配指令集合和设定的匹配参数生成并显示数据分析结果集合。其中,所述的数据分析结果生成过程,是在数据分析指令集合生成的结果中进一步筛选出具有匹配参数的结果,然后再显示具有该匹配参数的数据分析结果。所述数据分析结果可以在后台配置相关指令集合的展示权重,权重高的优先展示,否则按默认读取的顺序展示。
所述匹配参数包括时间参数、地域参数等。
本实施例中,在识别未匹配的关键词集合中的时间参数时,先判断是否通过校验函数可将关键词转化成正常的日期参数,若能,则将转换成的日期参数作为时间参数;若不能,则在自定义的时间文本集合中看是否存在匹配的文字,若存在,则对应的关键词即为时间参数。其他参数的做法也可按照上述方式进行识别。
例如,用户查询语句为“近一个月广州地区游戏平台新增用户”,获取到这个查询语句对应的关键词集合包括“近一个月”、“广州地区”、“游戏平台”和“新增用户”;其中,根据“游戏平台”和“新增用户”匹配索引到“游戏平台新增用户”的数据分析资源集合;而未匹配的“近一个月”和“广州地区”则形成未匹配的关键词集合,在该未匹配的关键词集合中,通过进一步检索判断是否存在与预设的时间、地域等参数类型相匹配的关键字,本例中识别出未匹配的关键词集合中存在时间参数“近一个月”和地域参数“广州地区”,进而根据数据分析资源集合、时间参数和地域参数在搜索栏下方的结果显示栏处显示出近一个月广州地区游戏平台新增用户的数据统计图。
在另一实施例中,所述生成并显示数据分析结果集合之后,还包括:根据用户标识符和用户搜索语句统计用户搜索历史,并显示生成用户热门搜索语句。所述统计用户搜索历史,包括:将用户标识符与用户搜索语句绑定存储至用户搜索日志,并统计生成用户热门搜索语句;在用户无输入并点击搜索栏时,在搜索栏的下拉框处显示该用户的热门搜索语句。
在另一实施例中,所述生成并显示数据分析结果集合之后,还包括:将用户自定义的搜索语句与用户指定的数据分析资源相映射存储,在用户输入自定义的搜索语句时,获取匹配 指定的数据分析资源集合,再生成并显示数据分析结果。
本发明同时提供一种基于搜索引擎技术的数据分析系统,包括处理器,适于实现各指令;以及存储器,适于存储多条指令,所述指令适于由处理器加载并执行:获取用户输入的搜索语句;根据搜索语句获取关键词集合;根据该关键词集合获取匹配的数据分析资源集合;根据匹配的数据分析资源集合,生成并显示数据分析结果集合。
在一个实施例中,所述处理器获取用户输入的搜索语句之后,所述处理器还加载并执行:获取搜索语句中的最后一个字,并调用数据分析资源索引词库,以在数据分析资源索引词库中获取与该字匹配的补全词汇集合,并在搜索栏的下拉框处显示该补全词汇集合;所述补全词汇集合的显示顺序为:以与搜索语句最后一个字往前数的连续匹配字数的多少,由多到少依序显示各个补全词汇。
在一个实施例中,所述搜索语句包括多个依序输入的搜索字,所述处理器获取用户输入的搜索语句时,所述处理器还加载并执行:实时获取用户输入的每个搜索字,并实时调用数据分析资源索引词库,以在数据分析资源索引词库中获取与该搜索字匹配的补全词汇集合,并在搜索栏的下拉框处动态显示该匹配的补全词汇集合,以使用户快速智能输入便于搜索的关键词,提高后续检索关键词的准确性。
在一个实施例中,所述处理器获取用户输入的搜索语句之后,所述处理器还加载并执行:判断所述搜索语句是否包含易错词汇,若包含易错词汇,则调用数据分析资源索引词库,将易错词汇替换为关键词汇,且在搜索栏下方显示易错词汇替换为关键词汇后的搜索语句。
在一个实施例中,在所述处理器获取用户输入的搜索语句之前,所述处理器还加载并执行:获取用户的身份信息,并根据用户的身份信息生成用户标识符。其中,获取用户的身份信息的方式可通过用户登录本申请的基于搜索引擎技术的数据分析系统来识别,而用户登录方式可包括口令识别、人脸识别、指纹识别、虹膜识别和静脉识别等。
所述根据搜索语句获取关键词集合,包括:将搜索语句输入已训练好的关键词获取模型,根据语料库并通过该关键词获取模型可从该搜索语句中解析出关键词集合;其中,所述关键词获取模型的训练建立方式为:通过在关键词获取模块中输入大量的搜索语句,并进行动宾语句的识别以及词义解析识别后建立,训练时采用的搜索语句为数据分析资源索引词库中的索引词集合。
所述语料库相当于自然语言库,可往语料库中添加保留词汇,动态修改语料库;将搜索语句在所述语料库中进行查询,可将用户所可能采用的自然语言表达的搜索词查询对应到数据分析资源索引词库中的关键词。
所述数据分析资源集合包括:数据分析图表、实时大数据云图、底层数据自助查询数据 画板和数据分析相关说明文档等。其中,对于数据分析图表、实时大数据云图、底层数据自助查询数据画板这类数据分析资源,通过读取数据分析资源的配置文件,辅以爬取对应web页面的指标,获取上述三种数据分析资源的索引词;对于数据分析相关说明文档,通过提取数据分析说明文档中的关键词,建立数据分析相关说明文档的索引词。
本实施例中,通过调用数据分析资源索引词库,将关键词集合的各个关键词与数据分析资源索引词库的各索引词进行匹配,以获取各索引词对应的数据分析资源,进而将各个数据分析资源拼接形成数据分析资源集合。其中,一个关键词可匹配到多个数据分析资源,多个关键词就可以匹配到多个数据分析资源,通过获取这些关键词的交集进而获取数据分析资源集合,如关键词A匹配到的数据分析资源为S1和S2;关键词B匹配到的数据分析资源为S2,则拼接后形成的数据分析资源即为A∩B=S2。
在一个实施例中,所述处理器生成并显示数据分析结果集合之前,所述处理器还加载并执行:根据用户标识符,判断用户是否有权限执行该数据分析资源集合,若无权限执行该数据分析资源集合,则生成并显示该数据分析资源集合的链接。若有权限执行该数据分析资源集合则生成并显示数据分析结果,如可视化的数据分析图表。
在一个实施例中,所述处理器生成数据分析结果集合之前,所述处理器还加载并执行:判断关键词集合中的各关键词是否均匹配有对应的数据分析资源,若是,则根据该数据分析资源集合和设定的匹配参数生成并显示数据分析结果集合;否则,获取关键词集合内未匹配的关键词,并形成未匹配的关键词集合,并在该未匹配的关键词集合中检索判断是否存在匹配参数,若存在匹配参数,则根据该数据匹配指令集合和该匹配参数生成并显示数据分析结果集合;若不存在匹配参数,则根据该数据匹配指令集合和设定的匹配参数生成并显示数据分析结果集合。其中,所述的数据分析结果生成过程,是在数据分析指令集合生成的结果中进一步筛选出具有匹配参数的结果,然后再显示具有该匹配参数的数据分析结果。所述数据分析结果可以在后台配置相关指令集合的展示权重,权重高的优先展示,否则按默认读取的顺序展示。
所述匹配参数包括时间参数、地域参数等。
本实施例中,在识别未匹配的关键词集合中的时间参数时,先判断是否通过校验函数可将关键词转化成正常的日期参数,若能,则将转换成的日期参数作为时间参数;若不能,则在自定义的时间文本集合中看是否存在匹配的文字,若存在,则对应的关键词即为时间参数。其他参数的做法也可按照上述方式进行识别。
例如,用户查询语句为“近一个月广州地区游戏平台新增用户”,获取到这个查询语句对应的关键词集合包括“近一个月”、“广州地区”、“游戏平台”和“新增用户”;其中,根据“游 戏平台”和“新增用户”匹配索引到“游戏平台新增用户”的数据分析资源集合;而未匹配的“近一个月”和“广州地区”则形成未匹配的关键词集合,在该未匹配的关键词集合中,通过进一步检索判断是否存在与预设的时间、地域等参数类型相匹配的关键字,本例中识别出未匹配的关键词集合中存在时间参数“近一个月”和地域参数“广州地区”,进而根据数据分析资源集合、时间参数和地域参数在搜索栏下方的结果显示栏处显示出近一个月广州地区游戏平台新增用户的数据统计图。
在另一实施例中,所述处理器生成并显示数据分析结果集合之后,所述处理器还加载并执行:根据用户标识符和用户搜索语句统计用户搜索历史,并显示生成用户热门搜索语句。所述统计用户搜索历史,包括:将用户标识符与用户搜索语句绑定存储至用户搜索日志,并统计生成用户热门搜索语句;在用户无输入并点击搜索栏时,在搜索栏的下拉框处显示该用户的热门搜索语句。
在另一实施例中,所述处理器生成并显示数据分析结果集合之后,所述处理器还加载并执行:将用户自定义的搜索语句与用户指定的数据分析资源相映射存储,在用户输入自定义的搜索语句时,获取匹配指定的数据分析资源集合,再生成并显示数据分析结果。
相比于现有技术,本发明用户只需要输入搜索语句,即可获取相匹配的数据分析资源,无需用户多次点击操作各个功能模块,也无需用户熟悉阅读复杂的使用说明,操作门槛低,操作方便快捷。
进一步地,通过关键词获取模型,可从用户输入的搜索语句中快速准确地获取关键词,实现精准定位数据分析资源;通过数据分析资源索引词库,对用户输入的搜索语句进行补全和纠正,并在搜索栏的下拉框处动态显示匹配的补全和纠正词汇,可使用户快速智能输入便于搜索的关键词,提高后续关键词检索的准确性;结合数据分析资源和匹配参数来生成数据分析结果,提高了数据分析结果获取的准确性。通过统计用户搜索历史和自定义搜索语句,以显示用户热门搜索语句和自定义指定的数据分析资源,进而实现个性化的推荐和定位,从而使操作更加便捷。
本发明还提供一种计算机可读存储介质,其上储存有计算机程序,该计算机程序被处理器执行时实现如上述任意一项所述的基于搜索引擎技术的数据分析方法的步骤。
本发明可采用在一个或多个其中包含有程序代码的存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机可读储存介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于:相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他 类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

Claims (27)

  1. 一种基于搜索引擎技术的数据分析方法,其特征在于,包括如下步骤:
    获取用户输入的搜索语句;
    根据搜索语句获取关键词集合;
    根据该关键词集合获取匹配的数据分析资源集合;
    根据匹配的数据分析资源集合,生成并显示数据分析结果集合。
  2. 根据权利要求1所述的基于搜索引擎技术的数据分析方法,其特征在于,所述根据搜索语句获取关键词集合,包括:将搜索语句输入已训练的关键词获取模型,根据语料库并通过该关键词获取模型解析出关键词集合,其中,所述关键词获取模型的训练建立方式为:通过输入大量的搜索语句,并进行动宾语句的识别以及词义解析识别的训练后建立。
  3. 根据权利要求1所述的基于搜索引擎技术的数据分析方法,其特征在于,所述获取用户输入的搜索语句之后,还包括:获取搜索语句中的最后一个字,并调用数据分析资源索引词库,以在数据分析资源索引词库中获取与该字匹配的补全词汇集合,并在搜索栏的下拉框处显示该补全词汇集合;所述补全词汇集合的显示顺序为:以与搜索语句最后一个字往前数的连续匹配字数的多少,由多到少依序显示各个补全词汇。
  4. 根据权利要求1所述的基于搜索引擎技术的数据分析方法,其特征在于,所述获取用户输入的搜索语句之后,还包括:判断所述搜索语句是否包含易错词汇,若包含易错词汇,则调用数据分析资源索引词库,将易错词汇替换为关键词汇,且在搜索栏下方显示易错词汇替换为关键词汇后的搜索语句。
  5. 根据权利要求1所述的基于搜索引擎技术的数据分析方法,其特征在于,所述生成并显示数据分析结果集合之前,还包括:判断关键词集合中的各关键词是否均匹配有对应的数据分析资源,若是,则根据该数据分析资源集合和设定的匹配参数生成并显示数据分析结果集合;否则,获取关键词集合内未匹配的关键词,以形成未匹配的关键词集合,并在该未匹配的关键词集合中检索判断是否存在匹配参数,若存在匹配参数,则根据该数据匹配指令集合和该匹配参数生成并显示数据分析结果集合;若不存在匹配参数,则根据该数据匹配指令集合和设定的匹配参数生成并显示数据分析结果集合。
  6. 根据权利要求1所述的基于搜索引擎技术的数据分析方法,其特征在于,在所述获取用户输入的搜索语句之前,还获取用户的身份信息,并根据用户的身份信息生成用户标识符。
  7. 根据权利要求6所述的基于搜索引擎技术的数据分析方法,其特征在于,所述执行该数据分析资源集合之前,还包括:根据用户标识符,判断用户是否有权限执行该数据分析资 源集合,若无权限执行该数据分析资源集合,则生成并显示该数据分析资源集合的链接;若有权限执行该数据分析资源集合,则生成并显示数据分析结果集合。
  8. 根据权利要求6所述的基于搜索引擎技术的数据分析方法,其特征在于,所述生成并显示数据分析结果集合之后,还包括:根据用户标识符和用户搜索语句统计用户搜索历史,并显示生成用户热门搜索语句;所述统计用户搜索历史,包括:将用户标识符与用户搜索语句绑定存储至用户搜索日志,并统计生成用户热门搜索语句;在用户无输入并点击搜索栏时,在搜索栏的下拉框处显示该用户的热门搜索语句。
  9. 根据权利要求6所述的基于搜索引擎技术的数据分析方法,其特征在于,所述生成并显示数据分析结果集合之后,还包括:将用户自定义的搜索语句与用户指定的数据分析资源相映射存储,在用户输入自定义的搜索语句时,获取匹配指定的数据分析资源集合,以生成并显示数据分析结果。
  10. 一种基于搜索引擎技术的数据分析系统,其特征在于,包括处理器,适于实现各指令;以及存储器,适于存储多条指令,所述指令适于由处理器加载并执行:
    获取用户输入的搜索语句;
    根据搜索语句获取关键词集合;
    根据该关键词集合获取匹配的数据分析资源集合;
    根据匹配的数据分析资源集合,生成并显示数据分析结果集合。
  11. 根据权利要求10所述的基于搜索引擎技术的数据分析系统,其特征在于,所述处理器加载并执行所述根据搜索语句获取关键词集合时,包括加载并执行:将搜索语句输入已训练的关键词获取模型,根据语料库并通过该关键词获取模型解析出关键词集合,其中,所述关键词获取模型的训练建立方式为:通过输入大量的搜索语句,并进行动宾语句的识别以及词义解析识别的训练后建立。
  12. 根据权利要求10所述的基于搜索引擎技术的数据分析系统,其特征在于,所述处理器加载并执行所述获取用户输入的搜索语句之后,还包括加载并执行:获取搜索语句中的最后一个字,并调用数据分析资源索引词库,以在数据分析资源索引词库中获取与该字匹配的补全词汇集合,并在搜索栏的下拉框处显示该补全词汇集合;所述补全词汇集合的显示顺序为:以与搜索语句最后一个字往前数的连续匹配字数的多少,由多到少依序显示各个补全词汇。
  13. 根据权利要求10所述的基于搜索引擎技术的数据分析系统,其特征在于,所述处理器加载并执行所述获取用户输入的搜索语句之后,还包括加载并执行:判断所述搜索语句是否包含易错词汇,若包含易错词汇,则调用数据分析资源索引词库,将易错词汇替换为关键 词汇,且在搜索栏下方显示易错词汇替换为关键词汇后的搜索语句。
  14. 根据权利要求10所述的基于搜索引擎技术的数据分析系统,其特征在于,所述处理器加载并执行所述生成并显示数据分析结果集合之前,还包括加载并执行:判断关键词集合中的各关键词是否均匹配有对应的数据分析资源,若是,则根据该数据分析资源集合和设定的匹配参数生成并显示数据分析结果集合;否则,获取关键词集合内未匹配的关键词,以形成未匹配的关键词集合,并在该未匹配的关键词集合中检索判断是否存在匹配参数,若存在匹配参数,则根据该数据匹配指令集合和该匹配参数生成并显示数据分析结果集合;若不存在匹配参数,则根据该数据匹配指令集合和设定的匹配参数生成并显示数据分析结果集合。
  15. 根据权利要求10所述的基于搜索引擎技术的数据分析系统,其特征在于,所述处理器加载并执行所述获取用户输入的搜索语句之前,还包括加载并执行:获取用户的身份信息,并根据用户的身份信息生成用户标识符。
  16. 根据权利要求15所述的基于搜索引擎技术的数据分析系统,其特征在于,所述处理器加载并执行该数据分析资源集合之前,还包括加载并执行:根据用户标识符,判断用户是否有权限执行该数据分析资源集合,若无权限执行该数据分析资源集合,则生成并显示该数据分析资源集合的链接;若有权限执行该数据分析资源集合,则生成并显示数据分析结果集合。
  17. 根据权利要求15所述的基于搜索引擎技术的数据分析系统,其特征在于,所述处理器加载并执行所述生成并显示数据分析结果集合之后,还包括加载并执行:根据用户标识符和用户搜索语句统计用户搜索历史,并显示生成用户热门搜索语句;所述统计用户搜索历史,包括:将用户标识符与用户搜索语句绑定存储至用户搜索日志,并统计生成用户热门搜索语句;在用户无输入并点击搜索栏时,在搜索栏的下拉框处显示该用户的热门搜索语句。
  18. 根据权利要求15所述的基于搜索引擎技术的数据分析系统,其特征在于,所述处理器加载并执行所述生成并显示数据分析结果集合之后,还包括加载并执行:将用户自定义的搜索语句与用户指定的数据分析资源相映射存储,在用户输入自定义的搜索语句时,获取匹配指定的数据分析资源集合,以生成并显示数据分析结果。
  19. 一种计算机可读存储介质,其上储存有计算机程序,其特征在于,该计算机程序被处理器执行时实现:
    获取用户输入的搜索语句;
    根据搜索语句获取关键词集合;
    根据该关键词集合获取匹配的数据分析资源集合;
    根据匹配的数据分析资源集合,生成并显示数据分析结果集合。
  20. 根据权利要求19所述的计算机可读存储介质,其上储存有计算机程序,其特征在于,所述计算机程序被处理器执行实现所述根据搜索语句获取关键词集合时,包括加载并执行实现:将搜索语句输入已训练的关键词获取模型,根据语料库并通过该关键词获取模型解析出关键词集合,其中,所述关键词获取模型的训练建立方式为:通过输入大量的搜索语句,并进行动宾语句的识别以及词义解析识别的训练后建立。
  21. 根据权利要求19所述的计算机可读存储介质,其特征在于,所述计算机程序被处理器执行实现所述获取用户输入的搜索语句之后,还包括加载并执行实现:获取搜索语句中的最后一个字,并调用数据分析资源索引词库,以在数据分析资源索引词库中获取与该字匹配的补全词汇集合,并在搜索栏的下拉框处显示该补全词汇集合;所述补全词汇集合的显示顺序为:以与搜索语句最后一个字往前数的连续匹配字数的多少,由多到少依序显示各个补全词汇。
  22. 根据权利要求19所述的计算机可读存储介质,其特征在于,所述计算机程序被处理器执行实现所述获取用户输入的搜索语句之后,还包括加载并执行实现:判断所述搜索语句是否包含易错词汇,若包含易错词汇,则调用数据分析资源索引词库,将易错词汇替换为关键词汇,且在搜索栏下方显示易错词汇替换为关键词汇后的搜索语句。
  23. 根据权利要求19所述的计算机可读存储介质,其特征在于,所述计算机程序被处理器执行实现所述生成并显示数据分析结果集合之前,还包括加载并执行实现:判断关键词集合中的各关键词是否均匹配有对应的数据分析资源,若是,则根据该数据分析资源集合和设定的匹配参数生成并显示数据分析结果集合;否则,获取关键词集合内未匹配的关键词,以形成未匹配的关键词集合,并在该未匹配的关键词集合中检索判断是否存在匹配参数,若存在匹配参数,则根据该数据匹配指令集合和该匹配参数生成并显示数据分析结果集合;若不存在匹配参数,则根据该数据匹配指令集合和设定的匹配参数生成并显示数据分析结果集合。
  24. 根据权利要求19所述的计算机可读存储介质,其特征在于,所述计算机程序被处理器执行实现所述获取用户输入的搜索语句之前,还包括加载并执行实现:获取用户的身份信息,并根据用户的身份信息生成用户标识符。
  25. 根据权利要求24所述的计算机可读存储介质,其特征在于,所述计算机程序被处理器执行实现该数据分析资源集合之前,还包括加载并执行实现:根据用户标识符,判断用户是否有权限执行该数据分析资源集合,若无权限执行该数据分析资源集合,则生成并显示该数据分析资源集合的链接;若有权限执行该数据分析资源集合,则生成并显示数据分析结果集合。
  26. 根据权利要求24所述的计算机可读存储介质,其特征在于,所述计算机程序被处理 器执行实现所述生成并显示数据分析结果集合之后,还包括加载并执行实现:根据用户标识符和用户搜索语句统计用户搜索历史,并显示生成用户热门搜索语句;所述统计用户搜索历史,包括:将用户标识符与用户搜索语句绑定存储至用户搜索日志,并统计生成用户热门搜索语句;在用户无输入并点击搜索栏时,在搜索栏的下拉框处显示该用户的热门搜索语句。
  27. 根据权利要求24所述的计算机可读存储介质,其特征在于,所述计算机程序被处理器执行实现所述生成并显示数据分析结果集合之后,还包括加载并执行实现:将用户自定义的搜索语句与用户指定的数据分析资源相映射存储,在用户输入自定义的搜索语句时,获取匹配指定的数据分析资源集合,以生成并显示数据分析结果。
PCT/CN2018/108769 2018-03-08 2018-09-29 一种基于搜索引擎技术的数据分析方法及系统 WO2019169858A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810190927.4A CN108345686B (zh) 2018-03-08 2018-03-08 一种基于搜索引擎技术的数据分析方法及系统
CN201810190927.4 2018-03-08

Publications (1)

Publication Number Publication Date
WO2019169858A1 true WO2019169858A1 (zh) 2019-09-12

Family

ID=62957531

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2018/108769 WO2019169858A1 (zh) 2018-03-08 2018-09-29 一种基于搜索引擎技术的数据分析方法及系统

Country Status (2)

Country Link
CN (1) CN108345686B (zh)
WO (1) WO2019169858A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160007A (zh) * 2019-12-13 2020-05-15 中国平安财产保险股份有限公司 基于bert语言模型的搜索方法、装置、计算机设备及存储介质
CN112765962A (zh) * 2021-01-15 2021-05-07 上海微盟企业发展有限公司 一种文本纠错方法、装置及介质
CN113325959A (zh) * 2021-05-26 2021-08-31 北京沃东天骏信息技术有限公司 一种输入语料的推荐方法和装置
CN116091000A (zh) * 2023-02-14 2023-05-09 深圳市万特网络科技有限公司 一种基于oa系统的资源智能化管理系统及方法
CN118069933A (zh) * 2024-04-22 2024-05-24 天津英信科技有限公司 一种基于机器智能的应用系统集成方法及系统

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108345686B (zh) * 2018-03-08 2021-12-28 广州赫炎大数据科技有限公司 一种基于搜索引擎技术的数据分析方法及系统
CN109801138A (zh) * 2019-01-21 2019-05-24 口碑(上海)信息技术有限公司 商品图片的搜索方法及装置
CN111475536B (zh) * 2019-01-23 2023-10-17 百度在线网络技术(北京)有限公司 基于搜索引擎的数据分析方法和装置
CN110147887A (zh) * 2019-04-19 2019-08-20 平安科技(深圳)有限公司 信息推荐方法、装置、介质、电子设备
CN110347788A (zh) * 2019-06-12 2019-10-18 平安科技(深圳)有限公司 业务查询方法、装置及存储介质、计算机设备
CN110990422A (zh) * 2019-12-11 2020-04-10 微创(上海)网络技术股份有限公司 一种基于自然语言的智能数据处理系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101196900A (zh) * 2007-12-27 2008-06-11 中国移动通信集团湖北有限公司 一种基于元数据的信息检索方法
US20180052908A1 (en) * 2016-08-16 2018-02-22 Ebay Inc. Semantic reverse search indexing of publication corpus
CN108345686A (zh) * 2018-03-08 2018-07-31 广州赫炎大数据科技有限公司 一种基于搜索引擎技术的数据分析方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079066A (zh) * 2007-06-29 2007-11-28 深圳市中科新业信息科技发展有限公司 一种网络审计中的数据分析系统及其方法
US20100058210A1 (en) * 2008-01-02 2010-03-04 Simon Johnson Online Investing
CN101789006A (zh) * 2010-01-29 2010-07-28 华东电网有限公司 基于智能搜索的电网企业信息集成系统的快速检索方法
CN103116649B (zh) * 2013-02-28 2016-09-14 用友网络科技股份有限公司 数据分析系统和数据分析方法
CN106919557A (zh) * 2017-02-22 2017-07-04 中山大学 一种结合主题模型的文档向量生成方法
CN107273409B (zh) * 2017-05-03 2020-12-15 广州赫炎大数据科技有限公司 一种网络数据采集、存储及处理方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101196900A (zh) * 2007-12-27 2008-06-11 中国移动通信集团湖北有限公司 一种基于元数据的信息检索方法
US20180052908A1 (en) * 2016-08-16 2018-02-22 Ebay Inc. Semantic reverse search indexing of publication corpus
CN108345686A (zh) * 2018-03-08 2018-07-31 广州赫炎大数据科技有限公司 一种基于搜索引擎技术的数据分析方法及系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160007A (zh) * 2019-12-13 2020-05-15 中国平安财产保险股份有限公司 基于bert语言模型的搜索方法、装置、计算机设备及存储介质
CN111160007B (zh) * 2019-12-13 2023-04-07 中国平安财产保险股份有限公司 基于bert语言模型的搜索方法、装置、计算机设备及存储介质
CN112765962A (zh) * 2021-01-15 2021-05-07 上海微盟企业发展有限公司 一种文本纠错方法、装置及介质
CN113325959A (zh) * 2021-05-26 2021-08-31 北京沃东天骏信息技术有限公司 一种输入语料的推荐方法和装置
CN116091000A (zh) * 2023-02-14 2023-05-09 深圳市万特网络科技有限公司 一种基于oa系统的资源智能化管理系统及方法
CN116091000B (zh) * 2023-02-14 2023-12-08 宁波紫熙物联科技有限公司 一种基于oa系统的资源智能化管理系统及方法
CN118069933A (zh) * 2024-04-22 2024-05-24 天津英信科技有限公司 一种基于机器智能的应用系统集成方法及系统

Also Published As

Publication number Publication date
CN108345686A (zh) 2018-07-31
CN108345686B (zh) 2021-12-28

Similar Documents

Publication Publication Date Title
WO2019169858A1 (zh) 一种基于搜索引擎技术的数据分析方法及系统
CN111666401B (zh) 基于图结构的公文推荐方法、装置、计算机设备及介质
RU2643467C1 (ru) Сопоставление разметки для похожих документов
US10552467B2 (en) System and method for language sensitive contextual searching
US10303689B2 (en) Answering natural language table queries through semantic table representation
KR20170046611A (ko) 질문문 생성 장치 및 컴퓨터 프로그램
CN109408821B (zh) 一种语料生成方法、装置、计算设备及存储介质
CN109947952B (zh) 基于英语知识图谱的检索方法、装置、设备及存储介质
JP2020191075A (ja) Web APIおよび関連エンドポイントの推薦
US20130124194A1 (en) Systems and methods for manipulating data using natural language commands
CN109471889B (zh) 报表加速方法、系统、计算机设备和存储介质
KR20210097347A (ko) 인공지능 기반 이미지 검색 방법 및 장치
CN105653701A (zh) 模型生成方法及装置、词语赋权方法及装置
CN112883030A (zh) 数据收集方法、装置、计算机设备和存储介质
CN113297251A (zh) 多源数据检索方法、装置、设备及存储介质
CN117112595A (zh) 一种信息查询方法、装置、电子设备及存储介质
CN110209780A (zh) 一种问题模板生成方法、装置、服务器及存储介质
CN111401034B (zh) 文本的语义分析方法、语义分析装置及终端
KR20210056131A (ko) 법령 분야 질의 응답 방법 및 장치
CN114391142A (zh) 使用结构化和非结构化数据的解析查询
Hosseini et al. Compositional generalization for natural language interfaces to web apis
KR101602342B1 (ko) 의미 태깅된 자연어 질의의 의도에 부합하는 정보 추출 및 제공 방법 및 시스템
JP2020071678A (ja) 情報処理装置、制御方法、プログラム
JP2019200582A (ja) 検索装置、検索方法及び検索プログラム
Ma et al. Api prober–a tool for analyzing web api features and clustering web apis

Legal Events

Date Code Title Description
NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18909079

Country of ref document: EP

Kind code of ref document: A1