CN112487159A - 检索方法、检索装置及计算机可读存储介质 - Google Patents

检索方法、检索装置及计算机可读存储介质 Download PDF

Info

Publication number
CN112487159A
CN112487159A CN202011306058.0A CN202011306058A CN112487159A CN 112487159 A CN112487159 A CN 112487159A CN 202011306058 A CN202011306058 A CN 202011306058A CN 112487159 A CN112487159 A CN 112487159A
Authority
CN
China
Prior art keywords
data
retrieval
keywords
index
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011306058.0A
Other languages
English (en)
Other versions
CN112487159B (zh
Inventor
李发明
刘志伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Zhongbo Kechuang Information Co ltd
Original Assignee
Shenzhen Zhongbo Kechuang Information Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Zhongbo Kechuang Information Co ltd filed Critical Shenzhen Zhongbo Kechuang Information Co ltd
Priority to CN202011306058.0A priority Critical patent/CN112487159B/zh
Publication of CN112487159A publication Critical patent/CN112487159A/zh
Application granted granted Critical
Publication of CN112487159B publication Critical patent/CN112487159B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • G06F16/3323Query formulation using system suggestions using document space presentation or visualization, e.g. category, hierarchy or range presentation and selection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种检索方法、检索装置及计算机可读存储介质,通过获取用户输入的目标关键词;确定与所述目标关键词匹配的数据索引关联的数据表,根据所述数据表确定所述目标关键词的类型;比对所述目标关键词与所述数据表中的各个数据索引,并确定与所述目标关键词匹配的数据索引;获取所述匹配的数据索引对应的检索数据;显示所述类型以及所述检索数据。提升了检索的准确性。

Description

检索方法、检索装置及计算机可读存储介质
技术领域
本发明涉及数据搜索技术领域,尤其涉及一种检索方法、检索装置及计算机可读存储介质。
背景技术
现有技术中,用户在进行检索时,检索装置会将用户输入的词组或者句子与现有的数据库中的词组或者句子直接进行匹配,比如,用户输入的检索词为“机房设备”,检索装置在数据库中查找所有包括“机房设备”的词组或者句子,并将查找的词组或者句子直接进行显示,此时显示的信息庞大,使得检索结果本身只是各种信息的简单罗列,用户无法从中得到真正需要的信息,使得检索的结果不准确。
发明内容
本发明的主要目的在于提供一种检索方法、检索装置及计算机可读存储介质,旨在解决检索的结果不准确的技术问题。
为实现上述目的,本发明提供一种检索方法,所述检索方法包括:
获取用户输入的目标关键词;
确定与所述目标关键词匹配的数据索引关联的数据表,根据所述数据表确定所述目标关键词的类型;
比对所述目标关键词与所述数据表中的各个数据索引,并确定与所述目标关键词匹配的数据索引;
获取所述匹配的数据索引对应的检索数据;
显示所述类型以及所述检索数据。
优选地,所述显示所述类型以及所述检索数据的步骤包括:
对各个所述检索数据按照所述类型进行分类;
将不同所述类型的所述检索数据显示至不同的子界面。
优选地,所述将不同所述类型的所述检索数据显示至不同的子界面的步骤包括:
获取同一类型的检索数据与所述目标关键词的匹配度;
按照所述匹配度在所述检索数据对应的类型的所述子界面依次显示所述检索数据。
优选地,所述获取同一类型的检索数据与所述目标关键词的匹配度的步骤包括:
获取每一所述目标关键词的预设词频;
根据所述预设词频,确定所述每一所述目标关键词的匹配评分权重;
根据所述目标关键词与所述检索数据的匹配结果以及所述匹配评分权重确定匹配评分值;
将所述匹配评分值作为所述匹配度。
优选地,所述获取用户输入的关键词的步骤之前,还包括:
获取服务器发送的数据,提取所述数据中的待分类关键词;
根据分类算法对所述待分类关键词进行分类,得到所述待分类关键词的类型;
将相同类型的所述待分类关键词加入同一所述数据表;
关联保存所述数据表对应的数据索引。
优选地,同一所述数据表中的所述待分类关键词的数量为两个以上,所述关联保存所述数据表对应的数据索引的步骤之前,还包括:
确定所述待分类关键词在所述数据表中出现的频率;
根据所述频率确定各个所述待分类关键词的索引序号;
根据所述索引序号以及所述待分类关键词,生成所述数据索引,所述数据索引包括所述索引序号以及所述待分类关键词;
所述确定与所述目标关键词匹配的数据索引关联的数据表的步骤包括:
根据所述索引序号,将所述目标关键词与数据索引进行匹配,得到所述目标关键词匹配的所述数据索引关联的所述数据表。
优选地,所述根据所述索引序号,将所述目标关键词与数据索引进行匹配,得到所述目标关键词匹配的所述数据索引关联的所述数据表的步骤包括:
根据所述索引序号,确定所述目标关键词与所述待分类关键词匹配的先后顺序;
根据所述匹配的先后顺序,依次将所述目标关键词与所述待分类关键词进行匹配;
在得到与所述目标关键词匹配的所述待分类关键词时,停止匹配,并确定所述关键词匹配的所述数据索引关联的所述数据表。
优选地,所述获取用户输入的目标关键词的步骤包括:
输出检索的提示信息;
在检测到针对所述提示信息触发的检索指令时,确定所述检索指令的类型,所述检索指令的类型包括语音检索指令以及文本检索指令;
根据所述检索指令的类型,确定针对所述目标关键词的提取方式;
根据所述提取方式,提取所述检索指令中的所述目标关键词。
此外,为实现上述目的,本发明还提供一种检索装置,所述检索装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的检索程序,所述检索程序被所述处理器执行时实现上述任一项所述的检索方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有检索程序,所述检索程序被处理器执行时实现上述任一项所述的检索方法的步骤。
本发明实施例提出的一种检索方法、检索装置及计算机可读存储介质,通过获取用户输入的目标关键词,确定与目标关键词匹配的数据索引关联的数据表,根据数据表确定目标关键词的类型,比对目标关键词与数据表中的各个数据索引,获取匹配的数据索引对应的检索数据,显示类型以及检索数据,通过将目标关键词与数据表中的数据索引进行匹配的到匹配的检索数据,在显示检索数据时,显示类型及检索数据,提升了检索的准确性。
附图说明
图1是本发明实施例方案涉及的硬件的结构示意图;
图2为本发明检索方法第一实施例的流程示意图;
图3为本发明检索方法第二实施例的流程示意图;
图4为本发明检索方法第三实施例的流程示意图;
图5为本发明检索方法第四实施例的流程示意图;
图6为本发明检索方法第五实施例的流程示意图;
图7为本发明检索方法第六实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
如图1所示,图1是本发明实施例方案涉及的硬件的结构示意图。
本发明实施例涉及的硬件或者终端可以是PC,也可以是智能手机、平板电脑、便携计算机等具有显示功能的终端设备。
如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及检索程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的检索程序,并执行以下操作:
获取用户输入的目标关键词;
确定与所述目标关键词匹配的数据索引关联的数据表,根据所述数据表确定所述目标关键词的类型;
比对所述目标关键词与所述数据表中的各个数据索引,并确定与所述目标关键词匹配的数据索引;
获取所述匹配的数据索引对应的检索数据;
显示所述类型以及所述检索数据。
进一步地,处理器1001可以调用存储器1005中存储的检索程序,还执行以下操作:
对各个所述检索数据按照所述类型进行分类;
将不同所述类型的所述检索数据显示至不同的子界面。
进一步地,处理器1001可以调用存储器1005中存储的检索程序,还执行以下操作:
获取同一类型的检索数据与所述目标关键词的匹配度;
按照所述匹配度在所述检索数据对应的类型的所述子界面依次显示所述检索数据。
进一步地,处理器1001可以调用存储器1005中存储的检索程序,还执行以下操作:
获取每一所述目标关键词的预设词频;
根据所述预设词频,确定所述每一所述目标关键词的匹配评分权重;
根据所述目标关键词与所述检索数据的匹配结果以及所述匹配评分权重确定匹配评分值;
将所述匹配评分值作为所述匹配度。
进一步地,处理器1001可以调用存储器1005中存储的检索程序,还执行以下操作:
获取服务器发送的数据,提取所述数据中的待分类关键词;
根据分类算法对所述待分类关键词进行分类,得到所述待分类关键词的类型;
将相同类型的所述待分类关键词加入同一所述数据表;
关联保存所述数据表对应的数据索引。
进一步地,处理器1001可以调用存储器1005中存储的检索程序,还执行以下操作:
确定所述待分类关键词在所述数据表中出现的频率;
根据所述频率确定各个所述待分类关键词的索引序号;
根据所述索引序号以及所述待分类关键词,生成所述数据索引,所述数据索引包括所述索引序号以及所述待分类关键词;
根据所述索引序号,将所述目标关键词与数据索引进行匹配,得到所述目标关键词匹配的所述数据索引关联的所述数据表。
进一步地,处理器1001可以调用存储器1005中存储的检索程序,还执行以下操作:
根据所述索引序号,确定所述目标关键词与所述待分类关键词匹配的先后顺序;
根据所述匹配的先后顺序,依次将所述目标关键词与所述待分类关键词进行匹配;
在得到与所述目标关键词匹配的所述待分类关键词时,停止匹配,并确定所述关键词匹配的所述数据索引关联的所述数据表。
进一步地,处理器1001可以调用存储器1005中存储的检索程序,还执行以下操作:
输出检索的提示信息;
在检测到针对所述提示信息触发的检索指令时,确定所述检索指令的类型,所述检索指令的类型包括语音检索指令以及文本检索指令;
根据所述检索指令的类型,确定针对所述目标关键词的提取方式;
根据所述提取方式,提取所述检索指令中的所述目标关键词。
参照图2,本发明第一实施例提供一种检索方法,所述检索方法包括:
步骤S10,获取用户输入的目标关键词;
在本实施例中,执行主体为终端设备。终端设备包括显示面板,显示面板用于显示类型以及检索数据;目标关键词为用户输入的关键词,目标关键词是包括至少一个字符的文本,目标关键词例如“机房”、“机房机柜路由器”;获取用户输入的目标关键词的方法是,在显示设备的显示面板显示搜索界面,搜索界面中显示文本框,并在文本框中接收用户输入的关键词,还可以通过语音获取用户输入的关键词,在此不做限定。
步骤S20,确定与所述目标关键词匹配的数据索引关联的数据表,根据所述数据表确定所述目标关键词的类型;
数据索引是预先设置的与数据表关联的索引,索引是对数据表中的某一列或多个列进行与排序的数据结构,数据表是一系列二维数据的集合,用来代表和存储数据对象之间的关系;数据表预先存储在终端设备中,终端设备通过抓取服务器的数据,对数据进行分类得到多个类型的数据,并将每个相同类型的数据存储至相同的数据表中,每个数据表关联数据索引,数据索引基于数据表生成。
在得到数据表之后,由于每一数据表均与类型对应,此时可以根据数据表确定目标关键词的类型,类型用于指示每一数据表中的数据的共性,比如,可以将名称、地点或者时间等设为某一数据表的类型。
步骤S30,比对所述目标关键词与所述数据表中的各个数据索引,并确定与所述目标关键词匹配的数据索引;
终端设备通过将目标关键词与数据索引进行比对,以得到与目标关键词匹配的数据索引,其中,数据索引包括词组,在比对时,通过将目标关键词与数据索引中的词组进行比对,在查找到一数据索引与目标关键词相同的词组时,表明目标关键词与该数据索引匹配;具体地,可以采用模糊匹配或者模式匹配的方式进行匹配,其中模糊匹配也称为字符串近似匹配。
步骤S40,获取所述匹配的数据索引对应的检索数据;
在得到匹配的数据索引之后,终端设备进一步确定匹配的数据索引对应的数据表,从数据表中查找到检索数据,检索数据是基于数据表中的数据生成的数据,检索数据可以是数据表中的部分或者全部数据。
在一场景中,用户输入的目标关键词为“路由器”,终端设备在获取到用户数输入的目标关键词之后,首先确定与“路由器”匹配的数据索引,在查询到数据索引中包括“路由器”时,根据数据表确定目标关键词的类型,此时数据表的类型为“网络设备”,因而所确定的目标关键词的类型“网络设备”,此时,还比对目标关键词与数据表中的数据索引,并得到与目标关键词匹配的数据索引,匹配的数据索引为“路由器”,获取与数据索引“路由器”对应的数据表中的检索数据,比如数据表中的检索数据可以包括路由器的名称、型号等信息。
步骤S50,显示所述类型以及所述检索数据。
终端设备在得到类型以及检索数据之后,将类型以检索数据在显示面板中进行显示,以使用户获悉检索结果。同时显示类型以及检索数据使得用户可以准确的获知自己输入的目标关键词所属的类型,而不是将检索结果简单地罗列,并且,通过数据索引可以准确的获取到数据表中的数据,并得到检索数据,能够提升检索的准确性。
在本实施例中,通过获取用户输入的目标关键词,确定与目标关键词匹配的数据索引关联的数据表,根据数据表确定目标关键词的类型,比对目标关键词与数据表中的各个数据索引,获取匹配的数据索引对应的检索数据,显示类型以及检索数据,通过将目标关键词与数据表中的数据索引进行匹配的到匹配的检索数据,在显示检索数据时,显示类型及检索数据,提升了检索的准确性。
参照图3,本发明第二实施例提供一种检索方法,基于上述图2所示的实施例,所述步骤S50包括:
步骤S51,对各个所述检索数据按照所述类型进行分类;
终端设备在显示类型以及检索数据时,为了使显示效果更加清晰、易于浏览,还对各个检索数据按照类型进行分类,以得到不同类型的检索数据。比如,不同类型可以包括“名称”、“型号”、“位置”、“时间”等。
步骤S52,将不同所述类型的所述检索数据显示至不同的子界面。
在得到不同类型的检索数据之后,将不同类型的检索数据显示至不同的子界面,其中,每一子界面显示一类型的检索数据;子界面可以是同一显示界面中划分的多个显示区域。为了使每一子界面中显示的元素更易于识读,可以将不同子界面之间划分界限,界限可以是显示在显示面板中的线条。
在本实施例中,通过对各个检索数据按照类型进行分类,将不同类型的检索数据显示至不同的子界面,使得检索数据以及类型的显示更清晰,提升了检索数据以及类型的显示效果。
参照图4,本发明第三实施例提供一种检索方法,基于上述图3所示的实施例,所述步骤S52包括:
步骤S521,获取同一类型的检索数据与所述目标关键词的匹配度;
匹配度为用于指示检索数据与目标关键词之间的相似程度的数学量,在获取匹配度时,可以根据相似度算法计算检索数据与目标关键词的相似度,相似度算法比如TF-IDF算法(英文全称:Term Frequency–Inverse Document Frequency,中文:词频-逆文本频率指数),当然,也可以通过其他算法计算匹配度。
此外,终端设备可以通过获取每一目标关键词的预设词频,预设词频是目标关键词在数据表中出现的频率,根据预设词频,确定每一目标关键词的匹配评分权重,其中,预设词频较大的目标关键词的匹配评分权重也较大,匹配评分权重为目标关键词对应的在计算匹配评分值时的权重,匹配评分权重的数据形式为数字,根据目标关键词与检索数据的匹配结果以及匹配评分权重确定匹配评分值,将匹配评分值作为匹配度。例如,目标关键词包括“路由器交换机区别”,终端设备通过查找分别得到“路由器”、“交换机”、“区别”在数据表中出现的频率为30次、20次、2次,此时,由于“路由器”、“交换机”出现的频率较高,其表明在显示检索结果时,“路由器”与“交换机”是用户需要搜索的信息的概率比较大,因此,可以为30设定权重,例如0.5,为20设定权重0.4,为区别设定权重0.1,此时计算出的匹配评分值为30*0.5+20*0.4+2*0.1=23.2,依次计算出其他检索数据与目标关键词的匹配评分值,假定其他匹配评分值为20.4,14.5,此时可以确定23.2为最大的匹配评分值,并按照匹配评分至的大小依次显示对应的检索数据,上述仅作举例,实际实现过程中,预设词频、权重均可以根据实际需要进行设定。
步骤S522,按照所述匹配度在所述检索数据对应的类型的所述子界面依次显示所述检索数据。
终端设备在得到匹配度之后,为了使用户快速获取到所需的检索结果,根据匹配度在检索数据对应的类型的子界面一次显示检索数据,具体而言,将匹配度从高至低显示对应的检索数据,每一检索数据均显示于对应的类型的子界面中。
在本是实施例中,通过获取同一类型的检索数据与目标关键词的匹配度,按照匹配度在检索数据对应的类型的子界面以此显示检索数据,从而使得终端设备将匹配度更大、准确度更大的检索数据优先显示,其中,终端设备还获取了每一目标关键词的预设词频,根据预设词频确定了每一目标关键词的匹配评分权重,根据匹配评分权重以及目标关键词与检索数据的匹配结果得到匹配评分值,从而使得检索结果与用户所需要查询的信息的相关性更高。
参照图5,本发明第四实施例提供一种检索方法,基于上述图2所示的实施例,所述步骤S10之前还包括:
步骤S60,获取服务器发送的数据,提取所述数据中的待分类关键词;
终端设备在获取用户输入的目标关键词之前,还需要先得到数据表以及数据表对应的数据索引,其方法是,获取服务器发送的数据,服务器可以为网络资源中任何可以访问的服务器,在获得服务器许可的情况下,抓取服务器中的数据,并提取数据中的待分类关键词,关键词提取的方案存在多种,例如:无监督关键词提取方法,包括基于统计特征的关键词提取、基于词图模型的关键词提取、基于主题的关键词提取,此外关键词提取还可以采用有监督关键提取,包括二分类提取方法。
步骤S70,根据分类算法对所述待分类关键词进行分类,得到所述待分类关键词的类型;
在得到待分类关键词之后,根据分类算法对待分类关键词进行分类,以得到待分类关键词的类型,其中,可以基于分类算法构建分类预测模型,并根据分类预测模型对待分类关键词进行分类,分类算法例如二分类算法。
步骤S80,将相同类型的所述待分类关键词加入同一所述数据表;
在确定了类型之后,终端设备首先确定相同类型的待分类关键词,并将同一类型的待分类关键词加入同一数据表,此时,每一数据表对应与类型关联,并且,每一数据表中均保存相同类型的待分类关键词。
步骤S90,关联保存所述数据表对应的数据索引。
为了使每一数据表在被检索时,提升检索的效率,终端设备确定数据表对应的数据索引,并通过数据索引进行匹配,而不是与数据表本身进行匹配,为此,终端设备首先关联数据表对应的数据索引,使每一数据表均关联数据索引,并在关联之后保存数据表对应的数据索引。
在本实施例中,通过获取服务器发送的数据,提取数据中的待分类关键词,根据分类算法对待分类关键词进行分类,得到待分类关键词的类型,将相同类型的待分类关键词加入同一数据表,关联保存数据表对应的数据索引,从而得到了与数据表关联的数据索引,便于通过数据索引进行匹配,提升了检索的效率。
参照图6,本发明第五实施例提供一种检索方法,基于上述图5所示的实施例,所述步骤S90之前包括:
步骤S100,确定所述待分类关键词在所述数据表中出现的频率;
为了进一步提升检索的效率或者速度,本实施例首先确定待分类关键词在数据表中出现的频率,频率可以是出现的次数,在确定频率时,提取所述数据表中的待分类关键词,并统计数量。
步骤S110,根据所述频率确定各个所述待分类关键词的索引序号;
在确定了每个待分类关键词在数据表中出现的频率之后,终端设备根据频率确定索引序号,索引序号用于指示在进行匹配时的匹配顺序,索引序号可以为数字,也可以采用其他数据形式代替,在确定索引序号时,可以采用多种方式,比如,可以将索引序号设置为依次递增的阿拉伯数字,并按照使用频率有大至小一次设置递增的数值。
步骤S120,根据所述索引序号以及所述待分类关键词,生成所述数据索引,所述数据索引包括所述索引序号以及所述待分类关键词;
在得到索引序号以及待分类关键词之后,根据索引序号以及待分类关键词,生成包括索引序号以及待分类关键词的数据索引,以使终端设备在对数据索引中的待分类关键词以及目标关键词进行匹配时,能根据索引序号进行匹配。
所述步骤S 20包括:
步骤S21,根据所述索引序号,将所述目标关键词与数据索引进行匹配,得到所述目标关键词匹配的所述数据索引关联的所述数据表,根据所述数据表确定所述目标关键词的类型。
终端设备根据索引序号,将目标关键词与数据索引进行匹配,具体而言,将目标关键词与数据索引中的待分类关键词进行匹配,并得到目标关键词匹配的数据索引关联的数据表。
由于数据索引中的待分类关键词可能包括多个,在存在大量的待分类关键词时,为了提升匹配的效率,可以首先根据索引序号,确定目标关键词与待分类关键词匹配的先后顺序,其中,在确定匹配顺序时,可以将序号在前的待分类关键词的匹配的顺序设置在前,并且,序号在前的待分类关键词在数据表中出现的频率较高;根据匹配的先后顺序,依次将目标关键词与待分类关键词进行匹配;在得到与目标关键词匹配的待分类关键词时,停止匹配,并确定关键词匹配的数据索引关联的数据表,在未得到与目标关键词匹配的待分类关键词时,持续进行匹配直至全部的待分类关键词与目标关键词匹配完成;其中,匹配过程也可以看作判断待分类关键词与目标关键词是否相同的过程,在待分类关键词与目标关键词相同的情况下,待分类关键词与目标关键词匹配,在待分类关键词与目标关键词不相同的情况下,待分类关键词与目标关键词不匹配。
在本实施例中,通过确定待分类关键词在所述数据表中出现的频率,根据频率确定各个待分类关键词的索引序号,根据索引序号以及待分类关键词,生成数据索引,数据索引中包括索引序号以及待分类关键词,进一步地,在确定目标关键词匹配的数据索引关联的数据表时,还根据索引序号,将目标关键词与数据索引进行匹配,得到目标关键词匹配的数据索引关联的数据表,从而能够根据索引序号依次进行匹配,提升匹配的效率。
参照图7,本发明第六实施例提供一种检索方法,基于上述任一实施例,所述步骤S10包括:
步骤S11,输出检索的提示信息;
终端设备在获取目标关键词时,首先输出检索的提示信息,提示信息可以是终端设备的显示面板中的文本输入框,也可以是语音输入的界面,其中,文本输入框用户用户输入字符,语音输入的界面中可以包括语音输入的按钮,此外,提示信息也可以是其他的形式,在此不做限定。
步骤S12,在检测到针对所述提示信息触发的检索指令时,确定所述检索指令的类型,所述检索指令的类型包括语音检索指令以及文本检索指令;
在检测到针对提示信息触发的检索指令时,确定检索指令的类型,检索指令的类型为语音检索指令或者文本检索指令,在确定检索指令的类型时,可以根据提示信息与检索指令的预设对应关系进行确定,比如,文本输入框与文本检索指令对应,语音输入按钮与语音检索指令对应。
步骤S13,根据所述检索指令的类型,确定针对所述目标关键词的提取方式;
步骤S14,根据所述提取方式,提取所述检索指令中的所述目标关键词。
由于不同类型的检索指令对应的数据形式不同,文本检索指令对应用户输入的文本数据,语音检索指令对应用户的语音数据,因此在提取检索指令中的关键词时,需要先确定检索指令的类型,并根据检索指令的类型,确定针对目标关键词的提取方式,对于文本检索指令而言,在提取检索指令中的目标关键词时,首先确定用户输入的字符,进而确定其中的目标关键词比如用户输入的字符为“路由器型号”,该字符中包括“路由器”“型号”以及一个空格符号,此时,终端设备将空格符号作为通配符,而不作为目标关键词,对于语音检索指令而言,终端设备首先通过语音识别技术提取语音中的词汇,并得到目标关键词。
在本实施例中,通过输出检索的提示信息,在检测到针对提示信息触发的检索指令时,确定检索指令的类型,根据检索指令的类型,确定针对目标关键词的提取方式,根据提取方式提取检索指令中的目标关键词,从而丰富了获取目标关键词的方式,丰富了用户的操作方式,提升了检索方法的适用性。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种检索方法,其特征在于,所述检索方法包括:
获取用户输入的目标关键词;
确定与所述目标关键词匹配的数据索引关联的数据表,根据所述数据表确定所述目标关键词的类型;
比对所述目标关键词与所述数据表中的各个数据索引,并确定与所述目标关键词匹配的数据索引;
获取所述匹配的数据索引对应的检索数据;
显示所述类型以及所述检索数据。
2.如权利要求1所述的检索方法,其特征在于,所述显示所述类型以及所述检索数据的步骤包括:
对各个所述检索数据按照所述类型进行分类;
将不同所述类型的所述检索数据显示至不同的子界面。
3.如权利要求2所述的检索方法,其特征在于,所述将不同所述类型的所述检索数据显示至不同的子界面的步骤包括:
获取同一类型的检索数据与所述目标关键词的匹配度;
按照所述匹配度在所述检索数据对应的类型的所述子界面依次显示所述检索数据。
4.如权利要求3所述的检索方法,其特征在于,所述获取同一类型的检索数据与所述目标关键词的匹配度的步骤包括:
获取每一所述目标关键词的预设词频;
根据所述预设词频,确定所述每一所述目标关键词的匹配评分权重;
根据所述目标关键词与所述检索数据的匹配结果以及所述匹配评分权重确定匹配评分值;
将所述匹配评分值作为所述匹配度。
5.如权利要求1所述的检索方法,其特征在于,所述获取用户输入的关键词的步骤之前,还包括:
获取服务器发送的数据,提取所述数据中的待分类关键词;
根据分类算法对所述待分类关键词进行分类,得到所述待分类关键词的类型;
将相同类型的所述待分类关键词加入同一所述数据表;
关联保存所述数据表对应的数据索引。
6.如权利要求5所述的检索方法,其特征在于,同一所述数据表中的所述待分类关键词的数量为两个以上,所述关联保存所述数据表对应的数据索引的步骤之前,还包括:
确定所述待分类关键词在所述数据表中出现的频率;
根据所述频率确定各个所述待分类关键词的索引序号;
根据所述索引序号以及所述待分类关键词,生成所述数据索引,所述数据索引包括所述索引序号以及所述待分类关键词;
所述确定与所述目标关键词匹配的数据索引关联的数据表的步骤包括:
根据所述索引序号,将所述目标关键词与数据索引进行匹配,得到所述目标关键词匹配的所述数据索引关联的所述数据表。
7.如权利要求6所述的检索方法,其特征在于,所述根据所述索引序号,将所述目标关键词与数据索引进行匹配,得到所述目标关键词匹配的所述数据索引关联的所述数据表的步骤包括:
根据所述索引序号,确定所述目标关键词与所述待分类关键词匹配的先后顺序;
根据所述匹配的先后顺序,依次将所述目标关键词与所述待分类关键词进行匹配;
在得到与所述目标关键词匹配的所述待分类关键词时,停止匹配,并确定所述关键词匹配的所述数据索引关联的所述数据表。
8.如权利要求1-7任一项所述的检索方法,其特征在于,所述获取用户输入的目标关键词的步骤包括:
输出检索的提示信息;
在检测到针对所述提示信息触发的检索指令时,确定所述检索指令的类型,所述检索指令的类型包括语音检索指令以及文本检索指令;
根据所述检索指令的类型,确定针对所述目标关键词的提取方式;
根据所述提取方式,提取所述检索指令中的所述目标关键词。
9.一种检索装置,其特征在于,所述检索装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的检索程序,所述检索程序被所述处理器执行时实现如权利要求1至8中任一项所述的检索方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有检索程序,所述检索程序被处理器执行时实现如权利要求1至8中任一项所述的检索方法的步骤。
CN202011306058.0A 2020-11-19 2020-11-19 检索方法、检索装置及计算机可读存储介质 Active CN112487159B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011306058.0A CN112487159B (zh) 2020-11-19 2020-11-19 检索方法、检索装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011306058.0A CN112487159B (zh) 2020-11-19 2020-11-19 检索方法、检索装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN112487159A true CN112487159A (zh) 2021-03-12
CN112487159B CN112487159B (zh) 2024-03-01

Family

ID=74932551

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011306058.0A Active CN112487159B (zh) 2020-11-19 2020-11-19 检索方法、检索装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN112487159B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113434215A (zh) * 2021-06-28 2021-09-24 青岛海尔科技有限公司 信息的加载方法、装置、存储介质及处理器
CN117009609A (zh) * 2023-08-08 2023-11-07 北京三维天地科技股份有限公司 一种样本库可视化管理方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5715446A (en) * 1995-05-22 1998-02-03 Matsushita Electric Industrial Co., Ltd. Information searching apparatus for searching text to retrieve character streams agreeing with a key word
US20050267871A1 (en) * 2001-08-14 2005-12-01 Insightful Corporation Method and system for extending keyword searching to syntactically and semantically annotated data
CN104283930A (zh) * 2013-07-11 2015-01-14 一零四资讯科技股份有限公司 安全索引的关键字搜索系统及建立该系统的方法
CN108170785A (zh) * 2017-12-26 2018-06-15 深圳Tcl新技术有限公司 终端搜索操作的引导方法、装置及计算机可读存储介质
CN110321344A (zh) * 2019-05-20 2019-10-11 平安普惠企业管理有限公司 关联数据的信息查询方法、装置、计算机设备及存储介质
CN110399568A (zh) * 2019-07-04 2019-11-01 Oppo广东移动通信有限公司 信息搜索方法、装置、终端及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5715446A (en) * 1995-05-22 1998-02-03 Matsushita Electric Industrial Co., Ltd. Information searching apparatus for searching text to retrieve character streams agreeing with a key word
US20050267871A1 (en) * 2001-08-14 2005-12-01 Insightful Corporation Method and system for extending keyword searching to syntactically and semantically annotated data
CN104283930A (zh) * 2013-07-11 2015-01-14 一零四资讯科技股份有限公司 安全索引的关键字搜索系统及建立该系统的方法
CN108170785A (zh) * 2017-12-26 2018-06-15 深圳Tcl新技术有限公司 终端搜索操作的引导方法、装置及计算机可读存储介质
CN110321344A (zh) * 2019-05-20 2019-10-11 平安普惠企业管理有限公司 关联数据的信息查询方法、装置、计算机设备及存储介质
CN110399568A (zh) * 2019-07-04 2019-11-01 Oppo广东移动通信有限公司 信息搜索方法、装置、终端及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FANGLIU等: "Effective keyword search in relational database", 《PROCEEDINGS OF THE 2006 ACM SIGMOD INTERNATIONAL CONFERENCE ON MANAGEMENT OF DATA》, pages 563 - 574 *
杨燕: "基于Solr的电信搜索引擎的设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》, pages 1 - 6 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113434215A (zh) * 2021-06-28 2021-09-24 青岛海尔科技有限公司 信息的加载方法、装置、存储介质及处理器
CN113434215B (zh) * 2021-06-28 2023-06-16 青岛海尔科技有限公司 信息的加载方法、装置、存储介质及处理器
CN117009609A (zh) * 2023-08-08 2023-11-07 北京三维天地科技股份有限公司 一种样本库可视化管理方法
CN117009609B (zh) * 2023-08-08 2024-05-07 北京三维天地科技股份有限公司 一种样本库可视化管理方法

Also Published As

Publication number Publication date
CN112487159B (zh) 2024-03-01

Similar Documents

Publication Publication Date Title
CN108846037B (zh) 提示搜索词的方法和装置
CN107085583B (zh) 一种基于内容的电子文档管理方法及装置
EP4109295A1 (en) Knowledge graph-based question answering method and apparatus, computer device, and medium
CN111159363A (zh) 一种基于知识库的问题答案确定方法及装置
US9798776B2 (en) Systems and methods for parsing search queries
JP2010009577A (ja) 情報処理装置、全文検索方法、全文検索プログラム、及び記録媒体
CN109299235B (zh) 知识库搜索方法、装置及计算机可读存储介质
WO2014040521A1 (zh) 搜索方法、系统及存储介质
US10380125B2 (en) Information processing apparatus and information processing method
CN111209372B (zh) 一种关键词的确定方法、装置、电子设备和存储介质
CN112487159B (zh) 检索方法、检索装置及计算机可读存储介质
CN109634436B (zh) 输入法的联想方法、装置、设备及可读存储介质
CN114021577A (zh) 内容标签的生成方法、装置、电子设备及存储介质
CN110795942B (zh) 基于语义识别的关键词确定方法、装置和存储介质
CN109063182B (zh) 一种基于语音搜题的内容推荐方法及电子设备
JP2020140503A (ja) 文書検索装置及び文書検索方法
CN117539990A (zh) 一种问题处理方法、装置、电子设备和存储介质
CN109033082B (zh) 语义模型的学习训练方法、装置及计算机可读存储介质
CN116628278A (zh) 多模态搜索方法、装置、存储介质和设备
CN115563515A (zh) 文本相似性检测方法、装置、设备及存储介质
CN115858742A (zh) 问题文本扩充方法、装置、设备及存储介质
CN112926297B (zh) 处理信息的方法、装置、设备和存储介质
CN110807322B (zh) 基于信息熵识别新词的方法、装置、服务器及存储介质
CN111949755A (zh) 危化品的信息查询方法、装置、电子设备和介质
CN113094469B (zh) 文本数据分析方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant