CN110059243B - 数据引擎优化方法、装置、设备和计算机可读存储介质 - Google Patents

数据引擎优化方法、装置、设备和计算机可读存储介质 Download PDF

Info

Publication number
CN110059243B
CN110059243B CN201910217261.1A CN201910217261A CN110059243B CN 110059243 B CN110059243 B CN 110059243B CN 201910217261 A CN201910217261 A CN 201910217261A CN 110059243 B CN110059243 B CN 110059243B
Authority
CN
China
Prior art keywords
data
data content
keywords
matching rate
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910217261.1A
Other languages
English (en)
Other versions
CN110059243A (zh
Inventor
吴成锐
刘国昌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Ryan Technology Co ltd
Original Assignee
Guangdong Ryan Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Ryan Technology Co ltd filed Critical Guangdong Ryan Technology Co ltd
Priority to CN201910217261.1A priority Critical patent/CN110059243B/zh
Publication of CN110059243A publication Critical patent/CN110059243A/zh
Application granted granted Critical
Publication of CN110059243B publication Critical patent/CN110059243B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3335Syntactic pre-processing, e.g. stopword elimination, stemming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据引擎优化方法,在网页的搜索窗口中接收到用户输入的问题后,从所述问题中筛选出关键词;根据所述关键词与预设数据类型的映射关系,确定所述关键词对应的数据类型;在确定的数据类型所在的数据库中,查找与所述关键词的匹配率达到预设阈值的数据内容,并按照匹配率从高到低的顺序在网页中显示查找到的数据内容。本发明还公开了一种数据引擎优化装置、设备和计算机可读存储介质。本发明提高了数据引擎查找数据的效率。

Description

数据引擎优化方法、装置、设备和计算机可读存储介质
技术领域
本发明涉及数据引擎领域,尤其涉及一种数据引擎优化方法、装置、设备和计算机可读存储介质。
背景技术
随着互联网技术的发展,人工智能技术也越来越成熟,人机交互的场景也越来越多,常见的人机交互场景是输入问句之后,通过关键词匹配得到结果。这种数据查询检索方式,在输入问句之后,在数据库中找到匹配的内容进行显示,随着数据量的增多,数据查询检索的效率越来越低。
发明内容
本发明的主要目的在于提出一种数据引擎优化方法及装置,旨在解决传统的数据查询检索方式,效率较低的技术问题。
为实现上述目的,本发明提供的一种数据引擎优化方法,所述数据引擎优化方法包括:
在网页的搜索窗口中接收到用户输入的问题后,从所述问题中筛选出关键词;
根据所述关键词与预设数据类型的映射关系,确定所述关键词对应的数据类型;
在确定的数据类型所在的数据库中,查找与所述关键词的匹配率达到预设阈值的数据内容,并按照匹配率从高到低的顺序在网页中显示查找到的数据内容。
优选地,所述根据所述关键词与预设数据类型的映射关系,确定所述关键词对应的数据类型的步骤之前,所述方法还包括:
在知识库中查找与所述关键词相似的各个词语;
根据相似度算法,将所述关键词与所述知识库中的各个词语进行相似度计算,得到各个相似度值;
将相似度值高于特定值的词语作为关键词。
优选地,所述按照匹配率从高到低的顺序在网页中显示查找到的数据内容的步骤之后,所述方法还包括:
在显示的数据内容所在区域检测到触控操作时,确定触控的数据内容;
对所述数据内容与所其匹配的关键词之间的匹配率执行增值操作,以更新所述数据内容与其匹配的关键词之间的匹配率。
优选地,所述对所述数据内容与所其匹配的关键词之间的匹配率执行增值操作,以更新所述数据内容与其匹配的关键词之间的匹配率的步骤包括:
判断所述数据内容的触控次数是否达到预设给定值;
当所述数据内容的触控次数达到预设给定值时,对所述数据内容与所其匹配的关键词之间的匹配率执行增值操作,以更新所述数据内容与其匹配的关键词之间的匹配率。
优选地,所述对所述数据内容与所其匹配的关键词之间的匹配率执行增值操作,以更新所述数据内容与其匹配的关键词之间的匹配率的步骤之后,所述方法还包括:
更新所述数据内容与其匹配的关键词之间的匹配率之后,若所述数据内容按照所述匹配率的排位往前移动,则清空所述数据内容的触控次数并重新计算。
优选地,所述若所述数据内容按照所述匹配率的排位往前移动,高亮显示排位发生变化的数据内容。
优选地,所述在网页的搜索窗口中接收到用户输入的问题后,从所述问题中筛选出关键词的步骤包括:
对用户输入的问题进行去停用词处理;
对处理后的所述问题进行分词,并将分词后的所述问题与预设的无意义词进行比对,以去除掉无意义词,以筛选出所述问题的关键词。
此外,为实现上述目的,本发明还提出一种数据引擎优化装置,所述数据引擎优化装置包括:
筛选模块,用于在网页的搜索窗口中接收到用户输入的问题后,从所述问题中筛选出关键词;
确定模块,用于根据所述关键词与预设数据类型的映射关系,确定所述关键词对应的数据类型;
处理模块,用于在确定的数据类型所在的数据库中,查找与所述关键词的匹配率达到预设阈值的数据内容,并按照匹配率从高到低的顺序在网页中显示查找到的数据内容。
此外,为实现上述目的,本发明还提出一种数据引擎优化设备,所述数据引擎优化设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的数据引擎优化程序,所述数据引擎优化程序被所述处理器执行时实现如上文所述的数据引擎优化方法的步骤。
此外,为实现上述目的,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有数据引擎优化程序,所述数据引擎优化程序被处理器执行时实现如上文所述的数据引擎优化方法的步骤。
本发明提出的数据引擎优化方法,在网页的搜索窗口中接收到用户输入的问题后,从所述问题中筛选出关键词,然后根据所述关键词与预设数据类型的映射关系,确定所述关键词对应的数据类型,之后在确定的数据类型所在的数据库中,查找与所述关键词的匹配率达到预设阈值的数据内容,并按照匹配率从高到低的顺序在网页中显示查找到的数据内容。实现了数据查询检索,是先根据关键词确定数据类型,最终在确定的数据类型对应的数据库进行数据的查询检索,提高了数据查询检索的效率。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的系统结构示意图;
图2为本发明数据引擎优化方法第一实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的解决方案主要是:在网页的搜索窗口中接收到用户输入的问题后,从所述问题中筛选出关键词,然后根据所述关键词与预设数据类型的映射关系,确定所述关键词对应的数据类型,之后在确定的数据类型所在的数据库中,查找与所述关键词的匹配率达到预设阈值的数据内容,并按照匹配率从高到低的顺序在网页中显示查找到的数据内容。实现了数据查询检索,是先根据关键词确定数据类型,最终在确定的数据类型对应的数据库进行数据的查询检索,提高了数据查询检索的效率。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的结构示意图。
如图1所示,该数据引擎优化设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元,比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,数据引擎优化设备还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。
本领域技术人员可以理解,图1中示出的数据引擎优化设备结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统以及数据引擎优化程序。其中,操作系统是管理和控制数据引擎优化设备硬件和软件资源的程序,支持数据引擎优化程序以及其它软件和/或程序的运行。
在图1所示的数据引擎优化设备中,网络接口1004主要用于接入网络;用户接口1003连接用户端,而处理器1001可以用于调用存储器1005中存储的问句推荐程序,并执行下文所述的数据引擎优化方法的步骤:
在网页的搜索窗口中接收到用户输入的问题后,从所述问题中筛选出关键词;
根据所述关键词与预设数据类型的映射关系,确定所述关键词对应的数据类型;
在确定的数据类型所在的数据库中,查找与所述关键词的匹配率达到预设阈值的数据内容,并按照匹配率从高到低的顺序在网页中显示查找到的数据内容。
进一步地,所述根据所述关键词与预设数据类型的映射关系,确定所述关键词对应的数据类型的步骤之前,所述数据引擎优化设备通过处理器1001调用存储器1005中存储的数据引擎优化程序,以执行以下步骤:
在知识库中查找与所述关键词相似的各个词语;
根据相似度算法,将所述关键词与所述知识库中的各个词语进行相似度计算,得到各个相似度值;
将相似度值高于特定值的词语作为关键词。
进一步地,所述按照匹配率从高到低的顺序在网页中显示查找到的数据内容的步骤之后,所述数据引擎优化设备通过处理器1001调用存储器1005中存储的数据引擎优化程序,以执行以下步骤:
在显示的数据内容所在区域检测到触控操作时,确定触控的数据内容;
对所述数据内容与所其匹配的关键词之间的匹配率执行增值操作,以更新所述数据内容与其匹配的关键词之间的匹配率。
进一步地,所述数据引擎优化设备通过处理器1001调用存储器1005中存储的数据引擎优化程序,以执行对所述数据内容与所其匹配的关键词之间的匹配率执行增值操作,以更新所述数据内容与其匹配的关键词之间的匹配率的步骤:
判断所述数据内容的触控次数是否达到预设给定值;
当所述数据内容的触控次数达到预设给定值时,对所述数据内容与所其匹配的关键词之间的匹配率执行增值操作,以更新所述数据内容与其匹配的关键词之间的匹配率。
进一步地,所述对所述数据内容与所其匹配的关键词之间的匹配率执行增值操作,以更新所述数据内容与其匹配的关键词之间的匹配率的步骤之后,所述数据引擎优化设备通过处理器1001调用存储器1005中存储的数据引擎优化程序,以执行以下步骤:
更新所述数据内容与其匹配的关键词之间的匹配率之后,若所述数据内容按照所述匹配率的排位往前移动,则清空所述数据内容的触控次数并重新计算。
进一步地,所述若所述数据内容按照所述匹配率的排位往前移动,高亮显示排位发生变化的数据内容。
进一步地,所述数据引擎优化设备通过处理器1001调用存储器1005中存储的数据引擎优化程序,以执行在网页的搜索窗口中接收到用户输入的问题后,从所述问题中筛选出关键词的步骤步骤:
对用户输入的问题进行去停用词处理;
对处理后的所述问题进行分词,并将分词后的所述问题与预设的无意义词进行比对,以去除掉无意义词,以筛选出所述问题的关键词。
基于上述的硬件结构,提出数据引擎优化方法的各个实施例。
参照图2,图2为本发明数据引擎优化方法第一实施例的流程示意图。
在本实施例中,所述数据引擎优化方法包括:
步骤S10,在网页的搜索窗口中接收到用户输入的问题后,从所述问题中筛选出关键词;
步骤S20,根据所述关键词与预设数据类型的映射关系,确定所述关键词对应的数据类型;
步骤S30,在确定的数据类型所在的数据库中,查找与所述关键词的匹配率达到预设阈值的数据内容,并按照匹配率从高到低的顺序在网页中显示查找到的数据内容。
在本实施例中,先接收用户在网页的搜索窗口中输入的问题,之后,在所述问题中筛选出关键词,其中,所述步骤S10包括:
步骤a,对用户输入的问题进行去停用词处理;
步骤b,对处理后的所述问题进行分词,并将分词后的所述问题与预设的无意义词进行比对,以去除掉无意义词,以筛选出所述问题的关键词。
即,先对用户输入的问题进行去停用词处理,所述停用词包括但不限于:连接词、介词、语气助词、副词、数字、数学字符、英文字符标点符号等等,对提取的各个问题进行去停用词处理后,再对处理后的各个问题进行分词,本实施例中,所述分词的方式可选为结巴分词,得到各个词语,所述结巴分词的方式举例如下:
若当前语句为:这个系统的搜索引擎的功能怎么样呢。
结巴分词后,得到的各个词语为:
这/个/系统/的/搜索/引擎/的/功能/怎么样/呢。
然后将分词后的各个词语与预设的无意义词进行比对,其中,所述预设的无意义词包括:″好吧″、″的″、″OK″、″知道了″、″谢谢″、″哦哦″、″您好″、″你好″等等。将分词后的各个词语与预设的无意义词进行比对之后,筛选掉与无意义词的相似度小于预设相似度的词语,即筛选掉无意义词。在筛选掉无意义词之后,即可得到所述问题的关键词。
应当理解,本实施例对问题进行去停用词处理,再进一步筛选掉无意义词题,相当于是对问题去除一些字符和词语干扰,以便后续进行问题搜索时,准确性更高。
在问题中提取出关键词之后,根据所述关键词与预设数据类型的映射关系,确定所述关键词对应的数据类型,其中,所述关键词与预设数据类型的映射关系可选为:一对一或者一对多,即一个关键词映射一种数据类型,或者一个关键词映射多种数据类型,关键词具体对应哪个或哪些数据类型是预先配置并存储到引擎的后台服务器中。该后台服务器中,每一种数据类型对应一个数据库,该数据库下存储有各种问题对应的数据内容,那么,在根据关键词映射的数据类型确定数据库之后,在确定的该数据库中,将关键词与数据库的所有数据内容进行比较,以查找与所述关键词的匹配率达到预设阈值的数据内容,并按照匹配率从高到低的顺序在网页中显示查找到的数据内容。
本发明提出的方案,在网页的搜索窗口中接收到用户输入的问题后,从所述问题中筛选出关键词,然后根据所述关键词与预设数据类型的映射关系,确定所述关键词对应的数据类型,之后在确定的数据类型所在的数据库中,查找与所述关键词的匹配率达到预设阈值的数据内容,并按照匹配率从高到低的顺序在网页中显示查找到的数据内容。实现了数据查询检索,是先根据关键词确定数据类型,最终在确定的数据类型对应的数据库进行数据的查询检索,提高了数据查询检索的效率。
进一步地,基于第一实施例提出本发明数据引擎优化方法的第二实施例。
数据引擎优化方法第二实施例与数据引擎优化方法第一实施例的区别在于,所述步骤S20之前,所述方法还包括:
步骤A,在知识库中查找与所述关键词相似的各个词语;
步骤B,根据相似度算法,将所述关键词与所述知识库中的各个词语进行相似度计算,得到各个相似度值;
步骤C,将相似度值高于特定值的词语作为关键词。
在本实施例中,从所述问题中筛选出关键词之后,为了提高数据引擎的效率,在知识库中查找与所述关键词相似的各个词语,然后根据相似度算法,将所述关键词与所述知识库中的各个词语进行相似度计算,得到各个相似度值,其中,该相似度算值的方法可以是雅可比相似度算法,余弦相似度算法,带TF-IDF的余弦相似度算法中的一种或几种,在此不做限定,之后,将相似度值高于特定值的词语作为关键词,所述特定值的具体数值不做限定。
在其他实施例中,可选将与各个关键词的相似度值最高的特定值对应的词语作为后续引擎的关键词。
在本实施例中,从所述问题中筛选出关键词之后,将关键词与知识库中的各个词语进行相似度计算,以确定出相似度值高于特定值的词语作为关键词,之后直接根据高于特定值的词语进行数据引擎搜索,提高了数据引擎的效率。
进一步地,基于第一实施例提出本发明数据引擎优化方法的第三实施例。
数据引擎优化方法第三实施例与数据引擎优化方法第一实施例的区别在于,所述步骤S30之后,所述方法还包括:
步骤D,在显示的数据内容所在区域检测到触控操作时,确定触控的数据内容;
步骤E,对所述数据内容与所其匹配的关键词之间的匹配率执行增值操作,以更新所述数据内容与其匹配的关键词之间的匹配率。
在本实施例中,在确定的数据类型所在的数据库中,查找与所述关键词的匹配率达到预设阈值的数据内容,并按照匹配率从高到低的顺序在网页中显示查找到的数据内容之后,若在显示的数据内容所在区域检测到触控操作时,先确定触控的数据内容,然后对所述数据内容与所其匹配的关键词之间的匹配率执行增值操作,以更新所述数据内容与其匹配的关键词之间的匹配率,其中,匹配率增值操作的增值率不做限定,根据实际需要进行限定。
进一步地,为了提高准确性,所述步骤E包括:
步骤E1,判断所述数据内容的触控次数是否达到预设给定值;
步骤E2,当所述数据内容的触控次数达到预设给定值时,对所述数据内容与所其匹配的关键词之间的匹配率执行增值操作,以更新所述数据内容与其匹配的关键词之间的匹配率。
此外,所述步骤E2之后,所述方法还包括:
步骤E3,更新所述数据内容与其匹配的关键词之间的匹配率之后,若所述数据内容按照所述匹配率的排位往前移动,则清空所述数据内容的触控次数并重新计算。
即,在更新所述数据内容与其匹配的关键词之间的匹配率之后,若触控的所述数据内容的匹配率高于之前排在其之前的数据内容,则调整被触控的数据内容的排位,以将数据内容按照所述匹配率的排位往前移动,并在移动排位之后,清空所述数据内容的触控次数并重新计算触控次数,以便所述数据内容的触控次数再次达到所述给定值时,再对所述数据内容与所其匹配的关键词之间的匹配率执行增值操作,具体的操作方式如上所述,此处不做赘述。
此外,所述若所述数据内容按照所述匹配率的排位往前移动,可选高亮显示排位发生变化的数据内容,以便提示数据引擎搜索的优化结果。
此外,本发明实施例还提出一种数据引擎优化装置,所述数据引擎优化装置包括:
筛选模块,用于在网页的搜索窗口中接收到用户输入的问题后,从所述问题中筛选出关键词;
确定模块,用于根据所述关键词与预设数据类型的映射关系,确定所述关键词对应的数据类型;
处理模块,用于在确定的数据类型所在的数据库中,查找与所述关键词的匹配率达到预设阈值的数据内容,并按照匹配率从高到低的顺序在网页中显示查找到的数据内容。
优选地,所述装置还包括:
查找模块,用于在知识库中查找与所述关键词相似的各个词语;
计算模块,用于根据相似度算法,将所述关键词与所述知识库中的各个词语进行相似度计算,得到各个相似度值;
所述处理模块,还用于将相似度值高于特定值的词语作为关键词。
优选地,所述确定模块,还用于在显示的数据内容所在区域检测到触控操作时,确定触控的数据内容;
所述装置还包括:
增值模块,用于对所述数据内容与所其匹配的关键词之间的匹配率执行增值操作,以更新所述数据内容与其匹配的关键词之间的匹配率。
优选地,所述增值模块包括:
判断单元,用于判断所述数据内容的触控次数是否达到预设给定值;
增值单元,用于当所述数据内容的触控次数达到预设给定值时,对所述数据内容与所其匹配的关键词之间的匹配率执行增值操作,以更新所述数据内容与其匹配的关键词之间的匹配率。
优选地,所述装置还包括:
清空模块,用于更新所述数据内容与其匹配的关键词之间的匹配率之后,若所述数据内容按照所述匹配率的排位往前移动,则清空所述数据内容的触控次数并重新计算。
优选地,所述装置还包括:
高亮模块,用于若所述数据内容按照所述匹配率的排位往前移动,高亮显示排位发生变化的数据内容。
优选地,所述筛选模块包括:
处理单元,用于对用户输入的问题进行去停用词处理;
筛选单元,用于对处理后的所述问题进行分词,并将分词后的所述问题与预设的无意义词进行比对,以去除掉无意义词,以筛选出所述问题的关键词。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有数据引擎优化程序,所述数据引擎优化程序被处理器执行时实现如下操作:
在网页的搜索窗口中接收到用户输入的问题后,从所述问题中筛选出关键词;
根据所述关键词与预设数据类型的映射关系,确定所述关键词对应的数据类型;
在确定的数据类型所在的数据库中,查找与所述关键词的匹配率达到预设阈值的数据内容,并按照匹配率从高到低的顺序在网页中显示查找到的数据内容。
优选地,所述根据所述关键词与预设数据类型的映射关系,确定所述关键词对应的数据类型的步骤之前,所述数据引擎优化程序被处理器执行时还可实现如下操作:
在知识库中查找与所述关键词相似的各个词语;
根据相似度算法,将所述关键词与所述知识库中的各个词语进行相似度计算,得到各个相似度值;
将相似度值高于特定值的词语作为关键词。
优选地,所述按照匹配率从高到低的顺序在网页中显示查找到的数据内容的步骤之后,所述数据引擎优化程序被处理器执行时还可实现如下操作:
在显示的数据内容所在区域检测到触控操作时,确定触控的数据内容;
对所述数据内容与所其匹配的关键词之间的匹配率执行增值操作,以更新所述数据内容与其匹配的关键词之间的匹配率。
优选地,所述数据引擎优化程序被处理器执行时还可实现对所述数据内容与所其匹配的关键词之间的匹配率执行增值操作,以更新所述数据内容与其匹配的关键词之间的匹配率的步骤:
判断所述数据内容的触控次数是否达到预设给定值;
当所述数据内容的触控次数达到预设给定值时,对所述数据内容与所其匹配的关键词之间的匹配率执行增值操作,以更新所述数据内容与其匹配的关键词之间的匹配率。
优选地,所述对所述数据内容与所其匹配的关键词之间的匹配率执行增值操作,以更新所述数据内容与其匹配的关键词之间的匹配率的步骤之后,所述数据引擎优化程序被处理器执行时还可实现以下操作:
更新所述数据内容与其匹配的关键词之间的匹配率之后,若所述数据内容按照所述匹配率的排位往前移动,则清空所述数据内容的触控次数并重新计算。
优选地,所述若所述数据内容按照所述匹配率的排位往前移动,高亮显示排位发生变化的数据内容。
优选地,所述数据引擎优化程序被处理器执行时还可实现在网页的搜索窗口中接收到用户输入的问题后,从所述问题中筛选出关键词的步骤:
对用户输入的问题进行去停用词处理;
对处理后的所述问题进行分词,并将分词后的所述问题与预设的无意义词进行比对,以去除掉无意义词,以筛选出所述问题的关键词。
需要说明的是,在本文中,术语″包括″、″包含″或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句″包括一个......″限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (7)

1.一种数据引擎优化方法,其特征在于,所述数据引擎优化方法包括:
在网页的搜索窗口中接收到用户输入的问题后,从所述问题中筛选出关键词;
根据所述关键词与预设数据类型的映射关系,确定所述关键词对应的数据类型;其中,所述关键词与预设数据类型的映射关系包括:一对多,即一个关键词映射多种数据类型;
在确定的数据类型所在的数据库中,查找与所述关键词的匹配率达到预设阈值的数据内容,并按照匹配率从高到低的顺序在网页中显示查找到的数据内容;
在显示的数据内容所在区域检测到触控操作时,确定触控的数据内容;
判断所述数据内容的触控次数是否达到预设给定值;
当所述数据内容的触控次数达到预设给定值时,对所述数据内容与所其匹配的关键词之间的匹配率执行增值操作,以更新所述数据内容与其匹配的关键词之间的匹配率;
若所述数据内容按照所述匹配率的排位往前移动,高亮显示排位发生变化的数据内容。
2.如权利要求1所述的数据引擎优化方法,其特征在于,所述根据所述关键词与预设数据类型的映射关系,确定所述关键词对应的数据类型的步骤之前,所述方法还包括:
在知识库中查找与所述关键词相似的各个词语;
根据相似度算法,将所述关键词与所述知识库中的各个词语进行相似度计算,得到各个相似度值;
将相似度值高于特定值的词语作为关键词。
3.如权利要求1所述的数据引擎优化方法,其特征在于,所述对所述数据内容与所其匹配的关键词之间的匹配率执行增值操作,以更新所述数据内容与其匹配的关键词之间的匹配率的步骤之后,所述方法还包括:
更新所述数据内容与其匹配的关键词之间的匹配率之后,若所述数据内容按照所述匹配率的排位往前移动,则清空所述数据内容的触控次数并重新计算。
4.如权利要求1-3任一项所述的数据引擎优化方法,其特征在于,所述在网页的搜索窗口中接收到用户输入的问题后,从所述问题中筛选出关键词的步骤包括:
对用户输入的问题进行去停用词处理;
对处理后的所述问题进行分词,并将分词后的所述问题与预设的无意义词进行比对,以去除掉无意义词,以筛选出所述问题的关键词。
5.一种数据引擎优化装置,其特征在于,所述数据引擎优化装置包括:
筛选模块,用于在网页的搜索窗口中接收到用户输入的问题后,从所述问题中筛选出关键词;
确定模块,用于根据所述关键词与预设数据类型的映射关系,确定所述关键词对应的数据类型;其中,所述关键词与预设数据类型的映射关系包括:一对多,即一个关键词映射多种数据类型;
处理模块,用于在确定的数据类型所在的数据库中,查找与所述关键词的匹配率达到预设阈值的数据内容,并按照匹配率从高到低的顺序在网页中显示查找到的数据内容;
所述确定模块,还用于在显示的数据内容所在区域检测到触控操作时,确定触控的数据内容;
增值模块,用于判断所述数据内容的触控次数是否达到预设给定值;当所述数据内容的触控次数达到预设给定值时,对所述数据内容与所其匹配的关键词之间的匹配率执行增值操作,以更新所述数据内容与其匹配的关键词之间的匹配率;
高亮模块,用于若所述数据内容按照所述匹配率的排位往前移动,高亮显示排位发生变化的数据内容。
6.一种数据引擎优化设备,其特征在于,所述数据引擎优化设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的数据引擎优化程序,所述数据引擎优化程序被所述处理器执行时实现如权利要求1至4中任一项所述的数据引擎优化方法的步骤。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有数据引擎优化程序,所述数据引擎优化程序被处理器执行时实现如权利要求1至4中任一项所述的数据引擎优化方法的步骤。
CN201910217261.1A 2019-03-21 2019-03-21 数据引擎优化方法、装置、设备和计算机可读存储介质 Active CN110059243B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910217261.1A CN110059243B (zh) 2019-03-21 2019-03-21 数据引擎优化方法、装置、设备和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910217261.1A CN110059243B (zh) 2019-03-21 2019-03-21 数据引擎优化方法、装置、设备和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110059243A CN110059243A (zh) 2019-07-26
CN110059243B true CN110059243B (zh) 2024-05-07

Family

ID=67317126

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910217261.1A Active CN110059243B (zh) 2019-03-21 2019-03-21 数据引擎优化方法、装置、设备和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110059243B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112491649A (zh) * 2020-11-17 2021-03-12 中国平安财产保险股份有限公司 接口联调测试方法、装置、电子设备及存储介质
CN113779230B (zh) * 2021-09-15 2024-03-19 广州网律互联网科技有限公司 一种基于法条理解的法条推荐方法、系统及设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101063975A (zh) * 2007-02-15 2007-10-31 刘二中 电子文本处理与检索的方法和系统
CN102236719A (zh) * 2011-07-25 2011-11-09 西交利物浦大学 基于网页分类的网页搜索引擎及快速查找方法
CN103425640A (zh) * 2012-05-14 2013-12-04 华为技术有限公司 一种多媒体问答系统及方法
CN108320255A (zh) * 2017-01-16 2018-07-24 软通动力信息技术(集团)有限公司 一种信息处理方法及装置
CN109033305A (zh) * 2018-07-16 2018-12-18 深圳前海微众银行股份有限公司 问题回答方法、设备及计算机可读存储介质
CN109033221A (zh) * 2018-06-29 2018-12-18 上海银赛计算机科技有限公司 答案生成方法、装置及服务器

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070124284A1 (en) * 2005-11-29 2007-05-31 Lin Jessica F Systems, methods and media for searching a collection of data, based on information derived from the data

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101063975A (zh) * 2007-02-15 2007-10-31 刘二中 电子文本处理与检索的方法和系统
CN102236719A (zh) * 2011-07-25 2011-11-09 西交利物浦大学 基于网页分类的网页搜索引擎及快速查找方法
CN103425640A (zh) * 2012-05-14 2013-12-04 华为技术有限公司 一种多媒体问答系统及方法
CN108320255A (zh) * 2017-01-16 2018-07-24 软通动力信息技术(集团)有限公司 一种信息处理方法及装置
CN109033221A (zh) * 2018-06-29 2018-12-18 上海银赛计算机科技有限公司 答案生成方法、装置及服务器
CN109033305A (zh) * 2018-07-16 2018-12-18 深圳前海微众银行股份有限公司 问题回答方法、设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN110059243A (zh) 2019-07-26

Similar Documents

Publication Publication Date Title
CN109190049B (zh) 关键词推荐方法、系统、电子设备和计算机可读介质
CN106682169B (zh) 一种应用标签挖掘方法、装置和应用搜索方法、服务器
CN109063000B (zh) 问句推荐方法、客服系统以及计算机可读存储介质
CN110096655B (zh) 搜索结果的排序方法、装置、设备及存储介质
CN111460289B (zh) 新闻资讯的推送方法和装置
CN109710834B (zh) 相似网页检测方法、装置、存储介质及电子设备
US9607095B2 (en) Browser collection method, system and terminal device, and computer-readable storage medium
CN105511783A (zh) 一种搜索方法及移动终端
CN110059243B (zh) 数据引擎优化方法、装置、设备和计算机可读存储介质
CN111752955A (zh) 数据处理方法、装置、设备及计算机可读存储介质
CN108182200B (zh) 基于语义相似度的关键词拓展方法和装置
CN114021577A (zh) 内容标签的生成方法、装置、电子设备及存储介质
CN114241501B (zh) 影像文档处理方法、装置及电子设备
CN106919593B (zh) 一种搜索的方法和装置
CN108388556B (zh) 同类实体的挖掘方法及系统
US11468125B2 (en) Resource search method and related product
CN106844406B (zh) 检索方法和检索装置
CN106570003B (zh) 数据推送方法及装置
CN106202127B (zh) 一种垂直搜索引擎对检索请求的处理方法及装置
CN106934007B (zh) 关联信息的推送方法及装置
CN107622125B (zh) 一种信息爬取方法和装置、电子设备
CN109299353A (zh) 一种网页信息搜索方法及装置
CN110941765A (zh) 搜索意图识别方法、信息搜索方法、装置及电子设备
CN112307273A (zh) 信息查询方法、装置及电子设备
CN106202390B (zh) 一种数据库完善系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant