CN110909190B - 数据搜索方法、装置、电子设备及存储介质 - Google Patents
数据搜索方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN110909190B CN110909190B CN201911129064.0A CN201911129064A CN110909190B CN 110909190 B CN110909190 B CN 110909190B CN 201911129064 A CN201911129064 A CN 201911129064A CN 110909190 B CN110909190 B CN 110909190B
- Authority
- CN
- China
- Prior art keywords
- data
- input information
- candidate
- searching
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000012216 screening Methods 0.000 claims description 20
- 238000007781 pre-processing Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 16
- 238000012545 processing Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9038—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例公开了一种数据搜索方法、装置、电子设备及存储介质,本申请实施例可以接收输入信息;在预设的数据集中基于所述输入信息进行搜索,得到第一目标数据;基于所述输入信息获取源数据;从所述数据集中搜索出与所述源数据匹配的数据,得到候选数据;展示所述第一目标数据和所述候选数据的并集。本申请实施例通过引入源数据作为对比源进行搜索,得到候选数据,再将源数据与直接通过输入信息进行搜索得到的第一目标数据取并集,提高了对数据搜索的效率和准确率。
Description
技术领域
本申请涉及数据处理技术领域,具体涉及一种数据搜索方法、装置、电子设备及存储介质。
背景技术
为了快速从数据库内查找到所需信息,数据搜索应运而生。现今随着网络技术的发展,通过数据搜索基本可以快速高效的获取所需信息,而数据搜索的适用范围也在逐渐扩大,比如,图片搜索是数据搜索的新兴应用方向之一。现今图片集多采用日期、文件夹、或拍摄地点等方式进行简单归类,而随着人们的图片存储量越来越大,通过上述归类方式从数据集内搜索特定图片的过程中,只能在归类方式的范围内进行搜索,比如搜索特定日期、特定城市、或特定文件夹等,然后对搜索到的内容进行再次浏览查找,导致图片搜索变得愈发低效,同时搜索准确率也很差。
发明内容
本申请实施例提供一种数据搜索方法、装置、电子设备及存储介质,可以提高数据搜索的效率和准确率。
第一方面,本申请实施例提供了一种数据搜索方法,包括:
接收输入信息;
在预设的数据集中基于所述输入信息进行搜索,得到第一目标数据;
基于所述输入信息获取源数据;
从所述数据集中搜索出与所述源数据匹配的数据,得到候选数据;
展示所述第一目标数据和所述候选数据的并集。
在一些实施方式中,所述基于所述输入信息获取源数据,包括:
在线搜索所述输入信息,得到初始源数据;
对所述初始源数据进行预处理,得到源数据。
在一些实施方式中,所述对所述初始源数据进行预处理,得到源数据,包括:
对所述初始源数据进行识别,确认主体内容;
基于所述主体内容对所述初始源数据进行修正,得到源数据。
在一些实施方式中,所述在预设的数据集中基于所述输入信息进行搜索,得到第一目标数据,包括:
获取所述数据集内数据的第一特征信息;
从所述数据集中筛选出所述第一特征信息与所述输入信息匹配的数据,得到第一目标数据。
在一些实施方式中,所述从所述数据集中搜索出与所述源数据匹配的数据,得到候选数据,包括:
提取所述数据集内数据的第二特征信息;
从所述数据集中筛选出所述第二特征信息与所述输入信息之间的相似度大于预设阈值的数据,得到候选数据。
在一些实施方式中,所述展示所述第一目标数据和所述候选数据的并集,包括:
展示所述第一目标数据,并判断所述候选数据内是否存在与所述第一目标数据相同的数据;
若存在,筛除所述候选数据内与第一目标数据相同的数据,得到第二目标数据;
展示所述第二目标数据。
在一些实施方式中,所述展示所述第一目标数据和所述候选数据的并集包括:
若所述第一目标数据和所述候选数据的并集不为空,展示所述第一目标数据和所述候选数据的并集;
若所述第一目标数据和所述候选数据的并集为空,展示预设信息。
第二方面,本申请实施例还提供了一种数据搜索装置,包括:
接收模块,用于接收输入信息;
搜索模块,用于在预设的数据集中基于所述输入信息进行搜索,得到第一目标数据;
获取模块,用于基于所述输入信息获取源数据;
匹配模块,用于从所述数据集中搜索出与所述源数据匹配的数据,得到候选数据;
展示模块,用于展示所述第一目标数据和所述候选数据的并集。
在一些实施方式中,所述获取模块包括搜索子模块和预处理子模块:
搜索子模块,用于在线搜索所述输入信息,得到初始源数据;
预处理子模块,用于对所述初始源数据进行预处理,得到源数据。
在一些实施方式中,所述预处理子模块具体用于:
对所述初始源数据进行识别,确认主体内容;
基于所述主体内容对所述初始源数据进行修正,得到源数据。
在一些实施方式中,搜索模块具体用于:
获取所述数据集内数据的第一特征信息;
从所述数据集中筛选出所述第一特征信息与所述输入信息匹配的数据,得到第一目标数据。
在一些实施方式中,匹配模块具体用于:
提取所述数据集内数据的第二特征信息;
从所述数据集中筛选出所述第二特征信息与所述输入信息之间的相似度大于预设阈值的数据,得到候选数据。
在一些实施方式中,展示模块具体用于:
展示所述第一目标数据,并判断所述候选数据内是否存在与所述第一目标数据相同的数据;
若存在,筛除所述候选数据内与第一目标数据相同的数据,得到第二目标数据;
展示所述第二目标数据。
在一些实施方式中,展示模块具体用于:
若所述第一目标数据和所述候选数据的并集不为空,展示所述第一目标数据和所述候选数据的并集;
若所述第一目标数据和所述候选数据的并集为空,展示预设信息。
第三方面,本申请实施例还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有程序代码,所述处理器调用所述存储器中的程序代码时执行本申请实施例提供的任一种数据搜索方法中的步骤。
第四方面,本申请实施例还提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行本申请实施例提供的任一种数据搜索方法中的步骤。
本申请实施例首先可以接收输入信息,然后根据输入信息对数据集进行搜索,得到第一目标数据,再基于输入信息获取源数据,并根据源数据对数据集进行搜索,得到候选数据,最后展示第一目标数据和候选数据的并集。本申请通过引入源数据作为对比源进行搜索,得到候选数据,再将源数据与直接通过输入信息进行搜索得到的第一目标数据取并集,提高了对数据搜索的效率和准确率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的数据搜索方法的流程示意图;
图2是本申请实施例提供的数据搜索装置的结构示意图;
图3是本申请实施例提供的数据搜索装置的另一结构示意图;
图4是本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参阅图1,图1是本申请一实施例提供的数据搜索方法的流程示意图。该数据搜索方法的执行主体可以是本申请实施例提供的数据搜索装置,或者集成了该数据搜索装置的电子设备,其中,该数据搜索装置可以采用硬件或者软件的方式实现,该电子设备可以是智能手机、平板电脑、掌上电脑、个人电脑、或者笔记本电脑等。该数据搜索方法可以包括:
101、接收输入信息。
输入信息可以是文字、数字、符号、或图片等形式,输入信息通常含义明确,以便后续过程基于此输入信息进行精准的搜索。比如,输入信息可以是“12”、“房子”等。其中,接收输入信息可以是接收来自外部的输入信息,也可以是接收系统自动发送(或触发)的输入信息,等等。比如,系统根据实际情况自动发送输入信息“##”等。
例如,电子设备上接收用户输入的输入信息(如“兔子”)。
102、在预设的数据集中基于输入信息进行搜索,得到第一目标数据。
预设的数据集是进行搜索的数据库,包含若干数据。数据的形式可以是文本、图片等。比如,数据集可以为短篇小说集等。该预设的数据集可以存储在本地,也可以存储在服务器或云端等。该预设的数据集内的数据量可以是恒定不变,也可以是根据实际需求或其他条件变动(比如增加、减少、或有增有减等)。在预设的数据集中基于输入信息进行搜索,得到第一目标数据。比如,可以在预设的数据集内,将输入信息作为搜索关键词进行搜索,得到第一目标数据。第一目标数据是预设的数据集的子集(若不存在符合条件的第一目标数据,则该子集为空)。
在一些实施方式中,在预设的数据集中基于输入信息进行搜索,得到第一目标数据,包括:获取数据集内数据的第一特征信息;从数据集中筛选出第一特征信息与输入信息匹配的数据,得到第一目标数据。
具体地,第一特征信息可以是任意形式的信息,比如,若输入信息为文字形式,则该第一特征信息可以为文字形式、图片形式、或数字形式等。获取数据集内数据的第一特征信息,可以是通过对数据集内每一数据进行识别以获取第一特征信息,也可以是对数据集内数据进行查找以获取第一特征信息,还可以是对数据集内数据进行数理统计或处理以获取第一特征信息,等等。从数据集中筛选出第一特征信息与输入信息匹配的数据,得到第一目标数据,其中,筛选出匹配第一特征信息与输入信息匹配的数据,可以是第一特征信息与输入信息二者相同或一定数值范围的相似(比如相似度大于A),也可以是二者在一定限制条件内的对应匹配(比如数值形式的第一特征信息与输入信息所对应的数值范围相匹配)。
例如,预设的数据集可以是电子设备内的图库,图库内的数据形式为图片,图库存储在电子设备本地,图库内的图片数量会根据用户的操作随时增加或减少。电子设备接收的输入信息为“兔子”,则电子设备对图库内的图片进行识别,以查找包含有文本“兔子”的图片,则数据集的第一特征信息即图片上有文本“兔子”,查找到的图片集即第一目标数据。
103、基于输入信息获取源数据。
源数据是通过对输入信息解析、处理、或比对得到的不同于输入信息的数据。源数据的形式可以与输入信息相同,也可以与输入信息不同。比如,对形式为文本的输入信息进行比对等操作,得到数字形式的源数据。
在一些实施方式中,基于输入信息获取源数据,包括:在线搜索输入信息,得到初始源数据;对初始源数据进行识别,确认主体内容;基于主体内容对初始源数据进行修正,得到源数据。
具体地,在线搜索是通过网络上的搜索引擎进行搜索,借助于不同搜索引擎的特点,在线搜索除了可以获取海量数据信息外,还能提高源数据的精确性。在线搜索可以是使用一个或者多个搜索引擎进行搜索,得到数据,若得到的数据大于一个,需要对数据进行剔除,最终保留一个数据,即为初始源数据。对初始源数据进行识别,确认主体内容,对初始源数据进行识别的过程与初始源数据的数据形式直接相关,初始源数据可以为图片、文字、或数字,所采取的识别方式有所不同。比如,初始源数据为图片,则对图片进行识别主要是借助识别模型,确认图片的主体形状(即主体内容)。基于主体内容对初始源数据进行修正,得到源数据。这里针对得到的主体内容,对初始源数据进行修正,可以是对初始源数据进行修改或不修改。
例如,基于输入信息“兔子”获取源数据,电子设备在搜索引擎上使用“兔子”作为关键词进行搜索,得到搜索结果中的第一张图片(包含一只兔子),该图片即为初始源数据,通过识别模型对此初始源数据进行识别,确认其中的主体内容(兔子的形状轮廓),再对初始源数据进行修改(只保留兔子的形状轮廓,删除除兔子的形状轮廓以外的所有内容),得到源数据(仅包含兔子的形状轮廓的图片)。
104、从数据集中搜索出与源数据匹配的数据,得到候选数据。
在一些实施方式中,从数据集中搜索出与源数据匹配的数据,得到候选数据,包括:提取数据集内数据的第二特征信息;从数据集中筛选出第二特征信息与输入信息之间的相似度大于预设阈值的数据,得到候选数据。
具体地,提取数据集内数据的第二特征信息,第二特征信息与第一特征信息的提取方式类似,但第二特征信息与第一特征信息是不同类别的特征信息。从数据集中筛选出第二特征信息与输入信息之间的相似度大于预设阈值的数据,得到候选数据,预设阈值可以根据实际需求灵活设置,第二特征信息与输入信息的相似度可以通过对二者若干特征对比,并对不同特征进行加权计算得到,也可以对二者的特征进行数理统计并获取统计值得到,等等。
例如,源数据可以为仅包含兔子的形状轮廓的图片,则对电子设备图库内的图片进行识别,并获取图片的轮廓信息(即第二特征信息)。接着将源数据与第二特征信息进行相似度对比,并筛选出相似度大于70%的图片(即候选数据),并将候选数据按照相似度从高到低排序。
105、展示第一目标数据和候选数据的并集。
并集是指第一目标数据所包含的数据和候选数据所包含的数据的合集。得到数据并展示数据在实际情况内可以是一个动态的过程,第一目标数据和候选数据可以在一段时间内被得到并被展示,例如,可以先展示第一目标数据中的部分数据和候选数据中的部分数据(即已经展示的数据),对于第一目标数据和候选数据中某一未展示的数据,需要先判断其是否与已经展示的数据相同,若相同,则舍弃该未展示的数据,若不同,则展示该数据,此展示过程的目的是避免重复展示。
在一些实施方式中,展示第一目标数据和候选数据的并集,包括:展示第一目标数据,并判断候选数据内是否存在与第一目标数据相同的数据;若存在,筛除候选数据内与第一目标数据相同的数据,得到第二目标数据;展示第二目标数据。
在一些实施方式中,展示第一目标数据和候选数据的并集包括:若第一目标数据和候选数据的并集不为空,展示第一目标数据和候选数据的并集;若第一目标数据和候选数据的并集为空,展示预设信息。
例如,若第一目标数据和候选数据的并集不为空,展示第一目标数据和候选数据的并集,设定第一目标数据为包含文本“兔子”的图片集,候选数据为与仅包含兔子的形状轮廓的图片的相似度大于70%的图片集。第一目标数据与候选数据为一段时间内不断获取的过程,优先展示第一目标数据,对于获取的候选数据先判断其是否与已展示的第一目标数据相同,若相同,剔除该候选数据,若不同,展示该候选数据,若已展示的数据包含第一目标数据与候选数据,则对未展示的第一目标数据或候选数据与已展示的数据进行对比,若相同,则筛除该未展示的第一目标数据或候选数据,若不相同,则展示该未展示的第一目标数据或候选数据。若第一目标数据和候选数据的并集为空,则展示“未找到相关搜索结果”或其他相关的提示信息。
本申请实施例首先可以接收输入信息,然后根据输入信息对数据集进行搜索,得到第一目标数据,再基于输入信息获取源数据,并根据源数据对数据集进行搜索,得到候选数据,最后展示第一目标数据和候选数据的并集。本申请通过引入源数据作为对比源进行搜索,得到候选数据,再将源数据与直接通过输入信息进行搜索得到的第一目标数据取并集,提高了对数据搜索的效率和准确率。
为便于更好的实施本申请实施例提供的数据搜索方法,本申请实施例还提供一种基于上述数据搜索方法的装置。其中名词的含义与上述数据搜索方法中相同,具体实现细节可以参考方法实施例中的说明。
请参阅图2,图2为本申请实施例提供的数据搜索装置的结构示意图,其中该数据搜索装置200可以包括接收模块201、搜索模块202、获取模块203、匹配模块204及展示模块205等。其中,
接收模块201,用于接收输入信息。
输入信息可以是文字、数字、符号、或图片等形式,输入信息通常含义明确,以便后续过程基于此输入信息进行精准的搜索。比如,输入信息可以是“12”、“房子”等。其中,接收输入信息可以是接收来自外部的输入信息,也可以是接收系统自动发送(或触发)的输入信息,等等。比如,系统根据实际情况自动发送输入信息“##”等。
搜索模块202,用于在预设的数据集中基于输入信息进行搜索,得到第一目标数据。
预设的数据集是进行搜索的数据库,包含若干数据。数据的形式可以是文本、图片等。比如,数据集可以为短篇小说集等。该预设的数据集可以存储在本地,也可以存储在服务器或云端等。该预设的数据集内的数据量可以是恒定不变,也可以是根据实际需求或其他条件变动(比如增加、减少、或有增有减等)。在预设的数据集中基于输入信息进行搜索,得到第一目标数据。比如,可以在预设的数据集内,将输入信息作为搜索关键词进行搜索,得到第一目标数据。第一目标数据是预设的数据集的子集(若不存在符合条件的第一目标数据,则该子集为空)。
在一些实施方式中,搜索模块202具体用于:获取数据集内数据的第一特征信息;从数据集中筛选出第一特征信息与输入信息匹配的数据,得到第一目标数据。
具体地,第一特征信息可以是任意形式的信息,比如,若输入信息为文字形式,则该第一特征信息可以为文字形式、图片形式、或数字形式等。获取数据集内数据的第一特征信息,可以是通过对数据集内每一数据进行识别以获取第一特征信息,也可以是对数据集内数据进行查找以获取第一特征信息,还可以是对数据集内数据进行数理统计或处理以获取第一特征信息,等等。从数据集中筛选出第一特征信息与输入信息匹配的数据,得到第一目标数据,其中,筛选出匹配第一特征信息与输入信息匹配的数据,可以是第一特征信息与输入信息二者相同或一定数值范围的相似(比如相似度大于A),也可以是二者在一定限制条件内的对应匹配(比如数值形式的第一特征信息与输入信息所对应的数值范围相匹配)。
获取模块203,用于基于输入信息获取源数据。
源数据是通过对输入信息解析、处理、或比对得到的不同于输入信息的数据。源数据的形式可以与输入信息相同,也可以与输入信息不同。比如,对形式为文本的输入信息进行比对等操作,得到数字形式的源数据。
如图3所示,在一些实施方式中,获取模块203包括搜索子模块2031和预处理子模块2032:
搜索子模块2031,用于在线搜索输入信息,得到初始源数据;
预处理子模块2032,用于对初始源数据进行预处理,得到源数据。
具体地,在线搜索是通过网络上的搜索引擎进行搜索,借助于不同搜索引擎的特点,在线搜索除了可以获取海量数据信息外,还能提高源数据的精确性。在线搜索可以是使用一个或者多个搜索引擎进行搜索,得到数据,若得到的数据大于一个,需要对数据进行剔除,最终保留一个数据,即为初始源数据。对初始源数据进行识别,确认主体内容,对初始源数据进行识别的过程与初始源数据的数据形式直接相关,初始源数据可以为图片、文字、或数字,所采取的识别方式有所不同。比如,初始源数据为图片,则对图片进行识别主要是借助识别模型,确认图片的主体形状(即主体内容)。基于主体内容对初始源数据进行修正,得到源数据。这里针对得到的主体内容,对初始源数据进行修正,可以是对初始源数据进行修改或不修改。
在一些实施方式中,预处理子模块2032具体用于:
对初始源数据进行识别,确认主体内容;
基于主体内容对初始源数据进行修正,得到源数据。
匹配模块204,用于从数据集中搜索出与源数据匹配的数据,得到候选数据。
在一些实施方式中,匹配模块204具体用于:提取数据集内数据的第二特征信息;从数据集中筛选出第二特征信息与输入信息之间的相似度大于预设阈值的数据,得到候选数据。
具体地,提取数据集内数据的第二特征信息,第二特征信息与第一特征信息的提取方式类似,但第二特征信息与第一特征信息是不同类别的特征信息。从数据集中筛选出第二特征信息与输入信息之间的相似度大于预设阈值的数据,得到候选数据,预设阈值可以根据实际需求灵活设置,第二特征信息与输入信息的相似度可以通过对二者若干特征对比,并对不同特征进行加权计算得到,也可以对二者的特征进行数理统计并获取统计值得到,等等。
展示模块205,用于展示第一目标数据和候选数据的并集。
并集是指第一目标数据所包含的数据和候选数据所包含的数据的合集。得到数据并展示数据在实际情况内可以是一个动态的过程,第一目标数据和候选数据可以在一段时间内被得到并被展示,例如,可以先展示第一目标数据中的部分数据和候选数据中的部分数据(即已经展示的数据),对于第一目标数据和候选数据中某一未展示的数据,需要先判断其是否与已经展示的数据相同,若相同,则舍弃该未展示的数据,若不同,则展示该数据,此展示过程的目的是避免重复展示。
在一些实施方式中,展示模块205具体用于:若第一目标数据和候选数据的并集不为空,展示第一目标数据,并判断候选数据内是否存在与第一目标数据相同的数据;若存在,筛除候选数据内与第一目标数据相同的数据,得到第二目标数据;展示第二目标数据。
若第一目标数据和候选数据的并集为空,展示预设信息。
例如,若第一目标数据和候选数据的并集不为空,展示第一目标数据和候选数据的并集,设定第一目标数据为包含文本“兔子”的图片集,候选数据为与仅包含兔子的形状轮廓的图片的相似度大于70%的图片集。第一目标数据与候选数据为一段时间内不断获取的过程,优先展示第一目标数据,对于获取的候选数据先判断其是否与已展示的第一目标数据相同,若相同,剔除该候选数据,若不同,展示该候选数据,若已展示的数据包含第一目标数据与候选数据,则对未展示的第一目标数据或候选数据与已展示的数据进行对比,若相同,则筛除该未展示的第一目标数据或候选数据,若不相同,则展示该未展示的第一目标数据或候选数据。若第一目标数据和候选数据的并集为空,则展示“未找到相关搜索结果”或其他相关的提示信息。
本申请实施例中接收模块201首先可以接收输入信息,然后搜索模块202根据输入信息对数据集进行搜索,得到第一目标数据,获取模块203再基于输入信息获取源数据,然后匹配模块204根据源数据对数据集进行搜索,得到候选数据,最后展示模块205展示第一目标数据和候选数据的并集。本申请通过引入源数据作为对比源进行搜索,得到候选数据,再将源数据与直接通过输入信息进行搜索得到的第一目标数据取并集,提高了对数据搜索的效率和准确率。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
图4示出了本发明实施例提供的电子设备的具体结构框图,该电子设备可以用于实施上述实施例中提供的数据搜索方法。该电子设备1200可以为智能手机或平板电脑等。
如图4所示,电子设备1200可以包括RF(Radio Frequency,射频)电路110、包括有一个或一个以上(图中仅示出一个)计算机可读存储介质的存储器120、输入单元130、显示单元140、传感器150、音频电路160、传输模块170、包括有一个或者一个以上(图中仅示出一个)处理核心的处理器180以及电源190等部件。本领域技术人员可以理解,图4中示出的电子设备1200结构并不构成对电子设备1200的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
RF电路110用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯。RF电路110可包括各种现有的用于执行这些功能的电路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。RF电路110可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。上述的无线网络可以使用各种通信标准、协议及技术,包括但并不限于全球移动通信系统(Global System for Mobile Communication,GSM)、增强型移动通信技术(Enhanced DataGSM Environment,EDGE),宽带码分多址技术(Wideband Code Division MultipleAccess,WCDMA),码分多址技术(Code Division Access,CDMA)、时分多址技术(TimeDivision Multiple Access,TDMA),无线保真技术(Wireless Fidelity,Wi-Fi)(如美国电气和电子工程师协会标准IEEE802.11a,IEEE 802.11b,IEEE802.11g和/或IEEE 802.11n)、网络电话(Voice over Internet Protocol,VoIP)、全球微波互联接入(WorldwideInteroperability for Microwave Access,Wi-Max)、其他用于邮件、即时通讯及短消息的协议,以及任何其他合适的通讯协议,甚至可包括那些当前仍未被开发出来的协议。
存储器120可用于存储软件程序以及模块,如上述实施例中数据搜索方法的程序指令/模块,处理器180通过运行存储在存储器120内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现数据搜索的功能。存储器120可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器120可进一步包括相对于处理器180远程设置的存储器,这些远程存储器可以通过网络连接至电子设备1200。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入单元130可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,输入单元130可包括触敏表面131以及其他输入设备132。触敏表面131,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面131上或在触敏表面131附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面131可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器180,并能接收处理器180发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面131。除了触敏表面131,输入单元130还可以包括其他输入设备132。具体地,其他输入设备132可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元140可用于显示由用户输入的信息或提供给用户的信息以及电子设备1200的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元140可包括显示面板141,可选的,可以采用LCD(Liquid CrystalDisplay,液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板141。进一步的,触敏表面131可覆盖显示面板141,当触敏表面131检测到在其上或附近的触摸操作后,传送给处理器180以确定触摸事件的类型,随后处理器180根据触摸事件的类型在显示面板141上提供相应的视觉输出。虽然在图4中,触敏表面131与显示面板141是作为两个独立的部件来实现输入和输出功能,但是在某些实施例中,可以将触敏表面131与显示面板141集成而实现输入和输出功能。
电子设备1200还可包括至少一种传感器150,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板141的亮度,接近传感器可在电子设备1200移动到耳边时,关闭显示面板141和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于电子设备1200还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路160、扬声器161,传声器162可提供用户与电子设备1200之间的音频接口。音频电路160可将接收到的音频数据转换后的电信号,传输到扬声器161,由扬声器161转换为声音信号输出;另一方面,传声器162将收集的声音信号转换为电信号,由音频电路160接收后转换为音频数据,再将音频数据输出处理器180处理后,经RF电路110以发送给比如另一终端,或者将音频数据输出至存储器120以便进一步处理。音频电路160还可能包括耳塞插孔,以提供外设耳机与电子设备1200的通信。
电子设备1200通过传输模块170(例如Wi-Fi模块)可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图4示出了传输模块170,但是可以理解的是,其并不属于电子设备1200的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器180是电子设备1200的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器120内的软件程序和/或模块,以及调用存储在存储器120内的数据,执行电子设备1200的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器180可包括一个或多个处理核心;在一些实施例中,处理器180可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器180中。
电子设备1200还包括给各个部件供电的电源190(比如电池),在一些实施例中,电源可以通过电源管理系统与处理器180逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源190还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,电子设备1200还可以包括摄像头(如前置摄像头、后置摄像头)、蓝牙模块等,在此不再赘述。具体在本实施例中,电子设备1200的显示单元140是触摸屏显示器,电子设备1200还包括有存储器120,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器120中,且经配置以由一个或者一个以上处理器180执行一个或者一个以上程序包含用于进行以下操作的指令:
接收输入信息;在预设的数据集中基于输入信息进行搜索,得到第一目标数据;基于输入信息获取源数据;从数据集中搜索出与源数据匹配的数据,得到候选数据;展示第一目标数据和候选数据的并集。
本申请实施例首先可以接收输入信息,然后根据输入信息对数据集进行搜索,得到第一目标数据,再基于输入信息获取源数据,并根据源数据对数据集进行搜索,得到候选数据,最后展示第一目标数据和候选数据的并集。本申请通过引入源数据作为对比源进行搜索,得到候选数据,再将源数据与直接通过输入信息进行搜索得到的第一目标数据取并集,提高了对数据搜索的效率和准确率。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对数据搜索方法的详细描述,此处不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种存储介质,其中存储有计算机程序,该计算机程序能够被处理器进行加载,以执行本申请实施例所提供的任一种数据搜索方法中的步骤。例如,该指令可以执行如下步骤:
接收输入信息;在预设的数据集中基于输入信息进行搜索,得到第一目标数据;基于输入信息获取源数据;从数据集中搜索出与源数据匹配的数据,得到候选数据;展示第一目标数据和候选数据的并集。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本申请实施例所提供的任一种数据搜索方法中的步骤,因此,可以实现本申请实施例所提供的任一种数据搜索方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种数据搜索方法、装置、电子设备及存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (9)
1.一种数据搜索方法,其特征在于,包括:
接收输入信息;
在预设的数据集中基于所述输入信息进行搜索,得到第一目标数据;
基于所述输入信息获取源数据;
基于所述源数据的数据特征对所述数据集内的数据进行特征提取,得到所述数据集内的数据的第二特征信息;
从所述数据集中筛选出所述第二特征信息与所述输入信息之间的相似度大于预设阈值的数据,得到候选数据;
展示所述第一目标数据和所述候选数据的并集。
2.根据权利要求1所述的数据搜索方法,其特征在于,所述基于所述输入信息获取源数据,包括:
在线搜索所述输入信息,得到初始源数据;
对所述初始源数据进行预处理,得到源数据。
3.根据权利要求2所述的数据搜索方法,其特征在于,所述对所述初始源数据进行预处理,得到源数据,包括:
对所述初始源数据进行识别,确认主体内容;
基于所述主体内容对所述初始源数据进行修正,得到源数据。
4.根据权利要求1所述的数据搜索方法,其特征在于,所述在预设的数据集中基于所述输入信息进行搜索,得到第一目标数据,包括:
获取所述数据集内数据的第一特征信息;
从所述数据集中筛选出所述第一特征信息与所述输入信息匹配的数据,得到第一目标数据。
5.根据权利要求1至4任一项所述的数据搜索方法,其特征在于,所述展示所述第一目标数据和所述候选数据的并集包括:
若所述第一目标数据和所述候选数据的并集不为空,展示所述第一目标数据和所述候选数据的并集;
若所述第一目标数据和所述候选数据的并集为空,展示预设信息。
6.根据权利要求5所述的数据搜索方法,其特征在于,所述展示所述第一目标数据和所述候选数据的并集,包括:
展示所述第一目标数据,并判断所述候选数据内是否存在与所述第一目标数据相同的数据;
若存在,筛除所述候选数据内与第一目标数据相同的数据,得到第二目标数据;
展示所述第二目标数据。
7.一种数据搜索装置,其特征在于,包括:
接收模块,用于接收输入信息;
搜索模块,用于在预设的数据集中基于所述输入信息进行搜索,得到第一目标数据;
获取模块,用于基于所述输入信息获取源数据;
匹配模块,用于基于所述源数据的数据特征对所述数据集内的数据进行特征提取,得到所述数据集内的数据的第二特征信息;从所述数据集中筛选出所述第二特征信息与所述输入信息之间的相似度大于预设阈值的数据,得到候选数据;
展示模块,用于展示所述第一目标数据和所述候选数据的并集。
8.一种电子设备,其特征在于,包括处理器和存储器,所述存储器中存储有程序代码,所述处理器调用所述存储器中的程序代码时执行如权利要求1至6任一项所述的数据搜索方法。
9.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行权利要求1至6任一项所述的数据搜索方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911129064.0A CN110909190B (zh) | 2019-11-18 | 2019-11-18 | 数据搜索方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911129064.0A CN110909190B (zh) | 2019-11-18 | 2019-11-18 | 数据搜索方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110909190A CN110909190A (zh) | 2020-03-24 |
CN110909190B true CN110909190B (zh) | 2022-12-09 |
Family
ID=69817858
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911129064.0A Active CN110909190B (zh) | 2019-11-18 | 2019-11-18 | 数据搜索方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110909190B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102855245A (zh) * | 2011-06-28 | 2013-01-02 | 北京百度网讯科技有限公司 | 一种用于确定图片相似度的方法与设备 |
CN103870597A (zh) * | 2014-04-01 | 2014-06-18 | 北京奇虎科技有限公司 | 一种无水印图片的搜索方法及装置 |
CN106776801A (zh) * | 2016-11-25 | 2017-05-31 | 杭州中奥科技有限公司 | 一种基于深度学习的图片搜索方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120155717A1 (en) * | 2010-12-16 | 2012-06-21 | Microsoft Corporation | Image search including facial image |
CN106919571A (zh) * | 2015-12-24 | 2017-07-04 | 北京奇虎科技有限公司 | 获取与搜索关键词相匹配的图片的方法及装置 |
CN106021362B (zh) * | 2016-05-10 | 2018-04-13 | 百度在线网络技术(北京)有限公司 | 查询式的图片特征表示的生成、图片搜索方法和装置 |
CN110020094B (zh) * | 2017-07-14 | 2023-06-13 | 阿里巴巴集团控股有限公司 | 一种搜索结果的展示方法和相关装置 |
CN107861970A (zh) * | 2017-09-15 | 2018-03-30 | 广州唯品会研究院有限公司 | 一种商品图片搜索方法和装置 |
CN107657024B (zh) * | 2017-09-27 | 2021-03-23 | 百度在线网络技术(北京)有限公司 | 一种搜索结果展示方法、装置、设备以及存储介质 |
-
2019
- 2019-11-18 CN CN201911129064.0A patent/CN110909190B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102855245A (zh) * | 2011-06-28 | 2013-01-02 | 北京百度网讯科技有限公司 | 一种用于确定图片相似度的方法与设备 |
CN103870597A (zh) * | 2014-04-01 | 2014-06-18 | 北京奇虎科技有限公司 | 一种无水印图片的搜索方法及装置 |
CN106776801A (zh) * | 2016-11-25 | 2017-05-31 | 杭州中奥科技有限公司 | 一种基于深度学习的图片搜索方法 |
Non-Patent Citations (2)
Title |
---|
fabric pattern retrieval based on maxium stable extremal regions;kang feng等;《journal of textile research》;20151231;第36卷(第10期);156-160 * |
基于边缘和颜色特征的织物印花花型检索;向衷等;《纺织学报》;20180515;第39卷(第5期);137-143 * |
Also Published As
Publication number | Publication date |
---|---|
CN110909190A (zh) | 2020-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108885614B (zh) | 一种文本和语音信息的处理方法以及终端 | |
US20170091335A1 (en) | Search method, server and client | |
CN107729815B (zh) | 图像处理方法、装置、移动终端及计算机可读存储介质 | |
CN106294308B (zh) | 命名实体识别方法及装置 | |
CN108494665B (zh) | 一种群消息显示方法及移动终端 | |
CN109561211B (zh) | 一种信息显示方法及移动终端 | |
CN111177180A (zh) | 一种数据查询方法、装置以及电子设备 | |
WO2019105457A1 (zh) | 图像处理方法、计算机设备和计算机可读存储介质 | |
CN108334196B (zh) | 一种文件处理方法及移动终端 | |
CN113220848B (zh) | 用于人机交互的自动问答方法、装置和智能设备 | |
EP3493112A1 (en) | Image processing method, computer device, and computer readable storage medium | |
CN104281394A (zh) | 智能选词的方法和装置 | |
CN107885718B (zh) | 语义确定方法及装置 | |
CN111339737B (zh) | 实体链接方法、装置、设备及存储介质 | |
CN108984066B (zh) | 一种应用程序图标显示方法及移动终端 | |
CN113190646B (zh) | 一种用户名样本的标注方法、装置、电子设备及存储介质 | |
CN112689201A (zh) | 弹幕信息识别方法、显示方法、服务器及电子设备 | |
CN109753202B (zh) | 一种截屏方法和移动终端 | |
CN110688497A (zh) | 资源信息搜索方法、装置、终端设备及存储介质 | |
CN108021669B (zh) | 图像分类方法和装置、电子设备、计算机可读存储介质 | |
CN107632985B (zh) | 网页预加载方法及装置 | |
CN106844572B (zh) | 搜索结果处理方法及装置、用于搜索结果处理的装置 | |
CN109063076B (zh) | 一种图片生成方法及移动终端 | |
CN108062370B (zh) | 一种应用程序搜索方法及移动终端 | |
CN117743170A (zh) | 测试用例生成方法、装置、存储介质及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |