CN105302867A - 一种搜索引擎查询方法及装置 - Google Patents

一种搜索引擎查询方法及装置 Download PDF

Info

Publication number
CN105302867A
CN105302867A CN201510626310.9A CN201510626310A CN105302867A CN 105302867 A CN105302867 A CN 105302867A CN 201510626310 A CN201510626310 A CN 201510626310A CN 105302867 A CN105302867 A CN 105302867A
Authority
CN
China
Prior art keywords
query
time section
current
sheet
querying condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510626310.9A
Other languages
English (en)
Other versions
CN105302867B (zh
Inventor
俞安琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Uniview Technologies Co Ltd
Original Assignee
Zhejiang Uniview Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Uniview Technologies Co Ltd filed Critical Zhejiang Uniview Technologies Co Ltd
Priority to CN201510626310.9A priority Critical patent/CN105302867B/zh
Publication of CN105302867A publication Critical patent/CN105302867A/zh
Application granted granted Critical
Publication of CN105302867B publication Critical patent/CN105302867B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种搜索引擎查询方法及装置,应用于搜索引擎服务器,该方法包括:获取用户输入的若干查询条件,所述若干查询条件中包含所述用户输入的第一查询时间段;根据所述用户输入的若干查询条件确定第二查询时间段,所述第二查询时间段小于或等于所述第一查询时间段;将所述第一查询时间段替换为所述第二查询时间段,向搜索引擎下发包含所述第二查询时间段的查询条件。本申请在满足用户查询信息量的情况下缩小用户输入的时间条件,从而缩小用户的查询范围,提升搜索引擎的查询性能。

Description

一种搜索引擎查询方法及装置
技术领域
本申请涉及搜索引擎技术领域,尤其涉及一种搜索引擎查询方法及装置。
背景技术
随着交通行业的大规模发展,需要存储以及查询的数据量不断增大。为了提升系统工作效率,交通系统中普遍采用搜索引擎技术。
现有交通系统的搜索引擎技术主要是按照时间划分索引段,但是划分索引段的时间粒度不能太小,否则影响查询性能。随着交通网络的不断扩大,接入摄像机的数量不断增多,在不改变索引段粒度的情况下,索引段内的数据量会不断增加,当达到一定数量时,用户基于索引段的查询排序将消耗大量的时间,无法满足交通行业的快速响应要求。
发明内容
有鉴于此,本申请提供一种搜索引擎查询方法及装置。
具体地,本申请是通过如下技术方案实现的:
本申请提供一种搜索引擎查询方法,应用于搜索引擎服务器,该方法包括:
获取用户输入的若干查询条件,所述若干查询条件中包含所述用户输入的第一查询时间段;
根据所述用户输入的若干查询条件确定第二查询时间段,所述第二查询时间段小于或等于所述第一查询时间段;
将所述第一查询时间段替换为所述第二查询时间段,向搜索引擎下发包含所述第二查询时间段的查询条件。
本申请提供一种搜索引擎查询装置,应用于搜索引擎服务器,该装置包括:
获取单元,用于获取用户输入的若干查询条件,所述若干查询条件中包含所述用户输入的第一查询时间段;
确定单元,用于根据所述用户输入的若干查询条件确定第二查询时间段,所述第二查询时间段小于或等于所述第一查询时间段;
下发单元,用于将所述第一查询时间段替换为所述第二查询时间段,向搜索引擎下发包含所述第二查询时间段的查询条件。
由以上描述可以看出,本申请在满足用户查询信息量的情况下缩小用户输入的时间条件,从而缩小用户的查询范围,提升搜索引擎的查询性能。
附图说明
图1是本申请一示例性实施例示出的一种搜索引擎查询方法流程图;
图2是本申请一示例性实施例示出的一种第二查询时间段确定方法流程图;
图3是本申请一示例性实施例示出的一种搜索引擎查询装置所在设备的基础硬件结构示意图;
图4是本申请一示例性实施例示出的一种搜索引擎查询装置的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
随着交通行业的大规模发展,需要存储以及查询的数据量不断增大。为了提升系统工作效率,交通系统中普遍采用搜索引擎技术。
现有交通系统的搜索引擎技术主要是按照时间划分索引段,但是划分索引段的时间粒度不能太小,否则影响查询性能,例如,可按月划分索引段。随着交通网络的不断扩大,接入摄像机的数量不断增多,在不改变索引段粒度的情况下,索引段内的数据量会不断增加,当达到一定数量时,例如,索引段内的记录达到1亿条时,满足用户查询条件的记录也会非常多,对这些满足查询条件的记录进行排序将消耗大量时间,无法满足交通行业的快速响应要求。
针对上述问题,本申请实施例提出一种搜索引擎查询方法,该方法通过预估算法在满足用户查询信息量的情况下缩小用户输入的时间条件,从而缩小用户的查询范围,提升搜索引擎的查询性能。
参见图1,为本申请搜索引擎查询方法的一个实施例流程图,该实施例对搜索引擎查询过程进行描述。
步骤101,获取用户输入的若干查询条件,所述若干查询条件中包含所述用户输入的第一查询时间段。
用户通过输入若干查询条件启动搜索引擎查询,以获取满足查询条件的记录。例如,用户拟查询某车辆的过车记录,输入“2015年8月1日到2015年8月3日”、“浙AJL123”、“黑色”,则搜索引擎根据上述查询条件进行筛选,返回满足查询条件的记录。其中,本申请实施例将用户输入的时间信息称为第一查询时间段。
步骤102,根据所述用户输入的若干查询条件确定第二查询时间段,所述第二查询时间段小于或等于所述第一查询时间段。
在步骤101中用户输入的第一查询时间段可能具有随意性,即使用户准确输入了其想要查询的时间段,但由于该时间段内记录的数量庞大,用户可能只需浏览位于前几页显示页面的记录,无法将所有记录都浏览一遍。如果将满足查询条件的所有记录都查询、排序并显示出来,将会影响搜索引擎的响应速度,同时,实用价值不高,造成不必要的资源浪费。
为此,本申请实施例根据用户输入的查询条件确定一个新的时间段,该时间段小于或等于第一查询时间段,以下将该新确定的时间段称为第二时间段。通过缩小查询时间段可以在满足用户浏览显示需求的基础上降低查询结果的总量,从而减少排序等消耗的时间,提高响应速度。
参见图2,为本申请第二查询时间段确定方法的一个实施例流程图。
步骤1021,按时间排序选择所述第一查询时间段中未参与结果总量预估操作的时间片。
搜索引擎服务器初始化时,首先进行时间片划分,该时间片的时间间隔较小。例如,9:00~9:15为一个时间片,9:15~9:30为一个时间片,9:30~9:45为一个时间片,以此类推,即每隔15分钟划分一个时间片。
在完成时间片划分后,搜索引擎服务器开始运行,并基于时间片对同一时间片内的记录进行分类统计。例如,以过车记录为例,搜索引擎服务器统计每一个时间片内的过车总量;统计每一个时间片内每一个车牌的数量;统计每一个时间片内不同颜色车辆的数量;等等。
当搜索引擎服务器接收到用户输入的查询条件时,预估满足该查询条件的查询结果总量。具体为,首先根据用户输入的第一查询时间段确定位于该时间段内的时间片,假设,用户输入的第一查询时间段为8:55~9:50,则根据前述时间片划分规则,该第一查询时间段包含9:00~9:15、9:15~9:30、9:30~9:45三个时间片。然后按照用户输入的时间排序方式(按时间正序或按时间倒序)顺序选择该第一查询时间段内的时间片执行后续查询结果总量预估操作。
步骤1022,预估当前时间片内满足所述查询条件的结果数量。
具体为,计算用户输入的每一个查询条件在当前时间片的预估频率,计算公式如下:
P=(P1-N*P2)公式(1)
其中,P1为当前查询条件的平均出现频率;P2为若干时间片内当前查询条件实际出现频率的标准差;N为调节系数。
以下对公式(1)中的参数举例说明,例如,以其中一个查询条件为车牌为例,P1为当前统计的该车牌的数量(到目前为止所有时间片内该车牌的总数量)占所有车牌总数量(所有时间片内所有车牌总数量)的百分比;P2为当前时刻之前的若干时间片(例如,前10个时间片)内该车牌实际出现频率的标准差,其中,该车牌在每一个时间片内的实际出现频率为其所在时间片内统计的该车牌的数量占对应时间片内所有车牌总数量的百分比;N为调节系数,例如,N等于3。上述各参数计算所需车牌数量可由搜索引擎服务器实时统计获得,参见步骤1021的描述。搜索引擎服务器在获取到上述各参数后,通过公式(1)计算得到该车牌在当前时间片内的预估频率P。
可见,由于标准差P2以及调节系数N的关系,通过公式(1)计算得到的查询条件在当前时间片的预估频率会小于该查询条件在每一个时间片内的实际出现频率。这是为了给出一个预估的查询结果总数量的下限值,即该预估的查询结果总数量要低于真实的查询数量,以满足用户的查询需求。
此外,公式(1)中的出现频率标准差P2随着系统的运行会趋于稳定,因此,当P2稳定后,不需要再计算该查询条件在每一个时间片内的实际出现频率,而是将稳定后的P2直接代入公式(1)计算每一个时间片的预估频率,可有效节约系统资源,提高用户的查询效率。
在计算得到每一个查询条件在当前时间片内的预估频率后,获取当前时间片内的记录总数,根据当前时间片内的记录总数以及每一个查询条件的预估频率计算当前时间片内满足用户输入的若干查询条件的结果数量。
具体为,求当前时间片内的记录总数与每一个查询条件的预估频率的乘积作为当前时间片内满足查询条件的结果数量。例如,以过车记录为例,假设,用户输入“8:55~9:50”、“浙A”、“黑色”,启动查询,假设,当前时间片(9:30~9:45)内的过车记录为100条,“浙A”的预估频率为80%,“黑色”的预估频率为60%,则当前时间片(9:30~9:45)同时满足上述两个查询条件的过车记录(查询结果数量)为100*80%*60%=48条。
步骤1023,将当前时间片的结果数量与当前已累计的查询结果总数量进行累加作为新的查询结果总数量。
如前所述,用户输入的第一查询时间段可能包含多个时间片,当前时间片的结果数量要与同一查询时间段内的其它时间片的结果数量逐步进行累加。
步骤1024,判断当前的查询结果总数量是否达到预设的查询结果数量阈值。
本申请实施例中预设了一个查询结果数量阈值,通过该阈值设定,使得根据用户输入查询条件返回的查询结果数量不至于过大,而影响查询的响应速度。该查询结果数量阈值可根据查询条件灵活设置,对于精细查询,可设置较小的查询结果数量阈值,例如,查询车牌“浙AMA123”的过车记录,可设置查询结果数量阈值为10万条;对于模糊查询,可设置较大的查询结果数量阈值,例如,查询车牌“浙A????6”的过车记录,可设置查询结果数量阈值为200万条。
当通过步骤1023对当前时间片的结果数量进行累计后,判断当前的查询结果总数量是否达到预设的查询结果数量阈值,若是,说明当前的查询结果总数量已可以满足用户的查询需求,无需再提供过多的查询记录,则执行步骤1025;若否,说明还可以继续获取满足查询条件的记录,则执行步骤1026。
步骤1025,按照时间排序方式选择所述第一查询时间段的起始时间点到所述当前时间片的截止时间点的时间区间作为第二查询时间段。
此处举例说明,假设,用户输入的第一查询时间段为8:55~9:50,查询条件为“浙A”、“黑色”,当前预设的查询结果数量阈值为10万,要求按照时间倒序排序。其中,第一查询时间段包含9:00~9:15、9:15~9:30、9:30~9:45三个时间片。假设,时间片9:30~9:45和9:15~9:30预估的满足查询条件的结果数量分别为5.5万和5万,则从9:30~9:45开始累计,累计到9:15~9:30时,查询结果总数量(5.5万+5万)已经超过查询结果数量阈值(10万),此时,不再累计9:00~9:15时间片,而将9:15~9:50作为第二查询时间段。可见,该第二查询时间段(9:15~9:50)小于用户输入的第一查询时间段(8:55~9:50),但是,返回的查询结果数量已可以满足用户的查询需求。
步骤1026,判断所述第一查询时间段中所有时间片是否均已参与查询结果总数量预估操作。
如果当前的查询结果总数量还没有达到预设的查询结果数量阈值,则可以顺利累计其它时间片的结果数量,如果用户输入的第一查询时间段内的所有时间片均已参与过累计,则说明用户输入的第一查询时间段内的查询结果总数量不大,不会影响查询响应速度,因此,执行步骤1027;若否,说明用户输入的第一查询时间段中还有未参与累计的时间片,则返回步骤1021。
步骤1027,将所述第一查询时间段作为所述第二查询时间段。
可见,通过步骤1021~步骤1027确定出第二查询时间段,该第二查询时间段小于或等于用户输入的第一查询时间段。
步骤103,将所述第一查询时间段替换为所述第二查询时间段,向搜索引擎下发包含所述第二查询时间段的查询条件。
搜索引擎根据下发的第二查询时间段进行查询,获取最终的查询结果,由于第二查询时间段相对于第一查询时间段进行了时间紧缩,因此,可降低返回的结果数量,提高查询效率。
现仍以过车记录为例,详细介绍搜索引擎查询过程。
假设,用户输入的第一查询时间段为2015年9月1日8:55~9:50,查询条件为“浙A”、“黑色”的过车记录,要求按时间倒序排序。
搜索引擎服务器预设查询结果数量阈值为300万条。根据用户输入的第一查询时间段,确定位于该时间段内的时间片为9:00~9:15、9:15~9:30、9:30~9:45,各时间片内的过车记录分别为200万条、300万条以及400万条。
搜索引擎服务器根据用户的排序要求,首先预估9:30~9:45时间片内满足用户查询条件的过车记录。预估过程如下:
分别计算查询条件“浙A”和“黑色”的预估频率,计算方法相同,以“浙A”为例,假设,从搜索引擎服务器开始运行到现在,记录的“浙A”车牌的过车记录为1亿条,记录的所有车牌的过车记录为1.25亿条,则“浙A”的平均出现频率P1为1/1.25=80%;假设,搜索引擎服务器当前处于初始运行阶段,则分别统计当前时刻之前的若干时间片内“浙A”的实际出现频率,实际出现频率为对应时间片内“浙A”的统计数量占该时间片内所有车牌统计数量的百分比,假设,统计了6个时间片内“浙A”的实际出现频率,分别为82%、76%、80%、83%、76%、83%,计算上述6个实际出现频率的标准差P2为3%;代入公式P=(P1-N*P2),假设,N为3,则9:30~9:45时间片内“浙A”车牌的预估频率为P=(80%-3*3%)=71%。
同理,计算9:30~9:45时间片内“黑色”车辆的预估频率为60%。则9:30~9:45时间片内满足“浙A”、“黑色”的过车记录为400万*71%*60%=170.4万,小于预设的查询结果数量阈值300万条。
继续预估9:15~9:30时间片内满足用户查询条件的过车记录,方法同上,假设9:15~9:30时间片内“浙A”车牌的预估频率为80%,“黑色”车辆的预估频率为70%。则9:15~9:30时间片内满足“浙A”、“黑色”的过车记录为300万*80%*70%=168万,加上9:30~9:45时间片的170.4万,累计满足查询条件的过车记录为338.4万条,超过预设的查询结果数量阈值300万条。因此,确定紧缩后的第二查询时间段为9:15~9:50,该第二查询时间段小于用户输入的第一查询时间段8:55~9:50。
向搜索引擎下发查询时间段9:15~9:50,以及“浙A”、“黑色”的查询条件,搜索引擎返回的查询结果中至少不会包含8:55~9:15时间范围内满足查询条件的过车记录,因此,可提高搜索引擎的查询以及排序的效率。
此外,当搜索引擎服务器运行稳定后,即连续计算的频率标准差P2基本不变时,例如,标准差P2基本稳定在1%时,无需再实时统计每一个时间片内查询条件(“浙A”或“黑色”)的实际出现频率,直接利用趋于稳定的标准差(1%)计算时间片内的预估频率即可。
与前述搜索引擎查询方法的实施例相对应,本申请还提供了搜索引擎查询装置的实施例。
本申请搜索引擎查询装置的实施例可以应用在搜索引擎服务器上。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在设备的处理器运行存储器中对应的计算机程序指令形成的。从硬件层面而言,如图3所示,为本申请搜索引擎查询装置所在设备的一种硬件结构图,除了图3所示的处理器、网络接口、以及存储器之外,实施例中装置所在的设备通常根据该设备的实际功能,还可以包括其他硬件,对此不再赘述。
请参考图4,为本申请一个实施例中的搜索引擎查询装置的结构示意图。该搜索引擎查询装置包括获取单元401、确定单元402以及下发单元403,其中:
获取单元401,用于获取用户输入的若干查询条件,所述若干查询条件中包含所述用户输入的第一查询时间段;
确定单元402,用于根据所述用户输入的若干查询条件确定第二查询时间段,所述第二查询时间段小于或等于所述第一查询时间段;
下发单元403,用于将所述第一查询时间段替换为所述第二查询时间段,向搜索引擎下发包含所述第二查询时间段的查询条件。
进一步地,所述确定单元402,包括:
时间片选择模块,用于按时间排序方式顺序选择所述第一查询时间段中未参与查询结果总数量预估操作的时间片;
数量预估模块,用于预估当前时间片内满足所述查询条件的结果数量;
数量累加模块,用于将当前时间片的结果数量与当前已累计的查询结果总数量进行累加作为新的查询结果总数量;
数量判断模块,用于判断当前的查询结果总数量是否达到预设的查询结果数量阈值;
结果处理模块,用于若是,则按照时间排序方式选择所述第一查询时间段的起始时间点到所述当前时间片的截止时间点的时间区间作为第二查询时间段;若否,判断所述第一查询时间段中所有时间片是否均已参与查询结果总数量预估操作,若是,将所述第一查询时间段作为所述第二查询时间段;若否,返回时间片选择模块。
进一步地,所述数量预估模块,包括:
预估频率计算子模块,用于计算每一个查询条件在当前时间片的预估频率;
记录总数获取子模块,用于获取当前时间片内的记录总数;
结果数量计算子模块,用于根据所述当前时间片内的记录总数以及每一个查询条件的预估频率计算当前时间片内满足所述查询条件的结果数量。
进一步地,所述预估频率计算子模块,具体用于:
P=(P1-N*P2)
其中,
P1为当前查询条件的平均出现频率;
P2为若干时间片内当前查询条件实际出现频率的标准差;
N为调节系数;
P为当前查询条件在当前时间片的预估频率。
进一步地,所述结果数量计算子模块,具体用于求当前时间片内的记录总数与每一个查询条件的预估频率的乘积作为当前时间片内满足所述查询条件的结果数量。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (10)

1.一种搜索引擎查询方法,应用于搜索引擎服务器,其特征在于,该方法包括:
获取用户输入的若干查询条件,所述若干查询条件中包含所述用户输入的第一查询时间段;
根据所述用户输入的若干查询条件确定第二查询时间段,所述第二查询时间段小于或等于所述第一查询时间段;
将所述第一查询时间段替换为所述第二查询时间段,向搜索引擎下发包含所述第二查询时间段的查询条件。
2.如权利要求1所述的方法,其特征在于,所述根据所述用户输入的若干查询条件确定第二查询时间段,包括:
执行如下查询结果总数量预估操作:按时间排序方式顺序选择所述第一查询时间段中未参与查询结果总数量预估操作的时间片;预估当前时间片内满足所述查询条件的结果数量;将当前时间片的结果数量与当前已累计的查询结果总数量进行累加作为新的查询结果总数量;
判断当前的查询结果总数量是否达到预设的查询结果数量阈值;若是,则按照时间排序方式选择所述第一查询时间段的起始时间点到所述当前时间片的截止时间点的时间区间作为第二查询时间段;若否,判断所述第一查询时间段中所有时间片是否均已参与查询结果总数量预估操作,若是,将所述第一查询时间段作为所述第二查询时间段;若否,返回执行查询结果总数量预估操作。
3.如权利要求2所述的方法,其特征在于,所述预估当前时间片内满足所述查询条件的结果数量,包括:
计算每一个查询条件在当前时间片的预估频率;
获取当前时间片内的记录总数;
根据所述当前时间片内的记录总数以及每一个查询条件的预估频率计算当前时间片内满足所述查询条件的结果数量。
4.如权利要求3所述的方法,其特征在于,所述计算每一个查询条件在当前时间片的预估频率,具体为:
P=(P1-N*P2)
其中,
P1为当前查询条件的平均出现频率;
P2为若干时间片内当前查询条件实际出现频率的标准差;
N为调节系数;
P为当前查询条件在当前时间片的预估频率。
5.如权利要求3所述的方法,其特征在于,所述根据所述当前时间片内的记录总数以及每一个查询条件的预估频率计算当前时间片内满足所述查询条件的结果数量,包括:
求当前时间片内的记录总数与每一个查询条件的预估频率的乘积作为当前时间片内满足所述查询条件的结果数量。
6.一种搜索引擎查询装置,应用于搜索引擎服务器,其特征在于,该装置包括:
获取单元,用于获取用户输入的若干查询条件,所述若干查询条件中包含所述用户输入的第一查询时间段;
确定单元,用于根据所述用户输入的若干查询条件确定第二查询时间段,所述第二查询时间段小于或等于所述第一查询时间段;
下发单元,用于将所述第一查询时间段替换为所述第二查询时间段,向搜索引擎下发包含所述第二查询时间段的查询条件。
7.如权利要求6所述的装置,其特征在于,所述确定单元,包括:
时间片选择模块,用于按时间排序方式顺序选择所述第一查询时间段中未参与查询结果总数量预估操作的时间片;
数量预估模块,用于预估当前时间片内满足所述查询条件的结果数量;
数量累加模块,用于将当前时间片的结果数量与当前已累计的查询结果总数量进行累加作为新的查询结果总数量;
数量判断模块,用于判断当前的查询结果总数量是否达到预设的查询结果数量阈值;
结果处理模块,用于若是,则按照时间排序方式选择所述第一查询时间段的起始时间点到所述当前时间片的截止时间点的时间区间作为第二查询时间段;若否,判断所述第一查询时间段中所有时间片是否均已参与查询结果总数量预估操作,若是,将所述第一查询时间段作为所述第二查询时间段;若否,返回时间片选择模块。
8.如权利要求7所述的装置,其特征在于,所述数量预估模块,包括:
预估频率计算子模块,用于计算每一个查询条件在当前时间片的预估频率;
记录总数获取子模块,用于获取当前时间片内的记录总数;
结果数量计算子模块,用于根据所述当前时间片内的记录总数以及每一个查询条件的预估频率计算当前时间片内满足所述查询条件的结果数量。
9.如权利要求8所述的装置,其特征在于:
所述预估频率计算子模块,具体用于:
P=(P1-N*P2)
其中,
P1为当前查询条件的平均出现频率;
P2为若干时间片内当前查询条件实际出现频率的标准差;
N为调节系数;
P为当前查询条件在当前时间片的预估频率。
10.如权利要求8所述的装置,其特征在于:
所述结果数量计算子模块,具体用于求当前时间片内的记录总数与每一个查询条件的预估频率的乘积作为当前时间片内满足所述查询条件的结果数量。
CN201510626310.9A 2015-09-28 2015-09-28 一种搜索引擎查询方法及装置 Active CN105302867B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510626310.9A CN105302867B (zh) 2015-09-28 2015-09-28 一种搜索引擎查询方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510626310.9A CN105302867B (zh) 2015-09-28 2015-09-28 一种搜索引擎查询方法及装置

Publications (2)

Publication Number Publication Date
CN105302867A true CN105302867A (zh) 2016-02-03
CN105302867B CN105302867B (zh) 2019-06-11

Family

ID=55200137

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510626310.9A Active CN105302867B (zh) 2015-09-28 2015-09-28 一种搜索引擎查询方法及装置

Country Status (1)

Country Link
CN (1) CN105302867B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107391502A (zh) * 2016-05-16 2017-11-24 阿里巴巴集团控股有限公司 时间间隔的数据查询方法、装置及索引构建方法、装置
CN109961632A (zh) * 2017-12-26 2019-07-02 浙江宇视科技有限公司 一种以路由的方式快速查询过车记录的方法及装置
CN111506600A (zh) * 2020-03-23 2020-08-07 杭州海康威视系统技术有限公司 分页查询方法、装置和电子设备

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110002378A1 (en) * 2009-07-02 2011-01-06 Qualcomm Incorporated Coding latency reductions during transmitter quieting
CN102385620A (zh) * 2011-10-25 2012-03-21 深圳市赛格导航科技股份有限公司 一种基于文件数据库的里程数据统计处理方法和系统
CN102495848A (zh) * 2011-11-17 2012-06-13 深圳市赛格导航科技股份有限公司 一种海量gps数据处理方法及系统
CN102647784A (zh) * 2012-04-20 2012-08-22 北京创毅讯联科技股份有限公司 上行同步控制调整方法及装置
CN103106280A (zh) * 2013-02-22 2013-05-15 浙江大学 一种道路网络环境下不确定时空轨迹数据的范围查询方法
CN103136327A (zh) * 2012-12-28 2013-06-05 中国矿业大学 一种基于局部特征聚类的时间序列符号化方法
CN104216924A (zh) * 2013-06-03 2014-12-17 肖瑞 基于趋势的时间序列索引
CN104298673A (zh) * 2013-07-17 2015-01-21 腾讯科技(深圳)有限公司 一种对应用程序推送的效果进行统计的方法、装置及系统
CN104331466A (zh) * 2014-10-31 2015-02-04 南京邮电大学 基于时空邻近搜索的移动轨迹序列模式快速挖掘方法
CN104331493A (zh) * 2014-11-17 2015-02-04 百度在线网络技术(北京)有限公司 通过计算机实现的用于生成趋势解释数据的方法及装置
CN104360905A (zh) * 2014-10-29 2015-02-18 中国建设银行股份有限公司 一种应用于it系统的自适应控制方法和装置
CN104484395A (zh) * 2014-12-12 2015-04-01 西安酷派软件科技有限公司 车辆违规查询方法、处理方法、查询系统和处理系统

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110002378A1 (en) * 2009-07-02 2011-01-06 Qualcomm Incorporated Coding latency reductions during transmitter quieting
CN102385620A (zh) * 2011-10-25 2012-03-21 深圳市赛格导航科技股份有限公司 一种基于文件数据库的里程数据统计处理方法和系统
CN102495848A (zh) * 2011-11-17 2012-06-13 深圳市赛格导航科技股份有限公司 一种海量gps数据处理方法及系统
CN102647784A (zh) * 2012-04-20 2012-08-22 北京创毅讯联科技股份有限公司 上行同步控制调整方法及装置
CN103136327A (zh) * 2012-12-28 2013-06-05 中国矿业大学 一种基于局部特征聚类的时间序列符号化方法
CN103106280A (zh) * 2013-02-22 2013-05-15 浙江大学 一种道路网络环境下不确定时空轨迹数据的范围查询方法
CN104216924A (zh) * 2013-06-03 2014-12-17 肖瑞 基于趋势的时间序列索引
CN104298673A (zh) * 2013-07-17 2015-01-21 腾讯科技(深圳)有限公司 一种对应用程序推送的效果进行统计的方法、装置及系统
CN104360905A (zh) * 2014-10-29 2015-02-18 中国建设银行股份有限公司 一种应用于it系统的自适应控制方法和装置
CN104331466A (zh) * 2014-10-31 2015-02-04 南京邮电大学 基于时空邻近搜索的移动轨迹序列模式快速挖掘方法
CN104331493A (zh) * 2014-11-17 2015-02-04 百度在线网络技术(北京)有限公司 通过计算机实现的用于生成趋势解释数据的方法及装置
CN104484395A (zh) * 2014-12-12 2015-04-01 西安酷派软件科技有限公司 车辆违规查询方法、处理方法、查询系统和处理系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107391502A (zh) * 2016-05-16 2017-11-24 阿里巴巴集团控股有限公司 时间间隔的数据查询方法、装置及索引构建方法、装置
CN107391502B (zh) * 2016-05-16 2020-08-04 阿里巴巴集团控股有限公司 时间间隔的数据查询方法、装置及索引构建方法、装置
CN109961632A (zh) * 2017-12-26 2019-07-02 浙江宇视科技有限公司 一种以路由的方式快速查询过车记录的方法及装置
CN111506600A (zh) * 2020-03-23 2020-08-07 杭州海康威视系统技术有限公司 分页查询方法、装置和电子设备

Also Published As

Publication number Publication date
CN105302867B (zh) 2019-06-11

Similar Documents

Publication Publication Date Title
US9619524B2 (en) Personalizing scoping and ordering of object types for search
CN102446171B (zh) 基于加权平均点进率评测推广关键词质量度的方法与设备
US20100153431A1 (en) Alert triggered statistics collections
CN108173698B (zh) 网络服务管理方法、装置、服务器及存储介质
US11163735B2 (en) Database capacity estimation for database sizing
US9928276B2 (en) Processing records in dynamic ranges
CN108595254B (zh) 一种查询调度方法
CN102193929A (zh) 确定词信息熵及利用词信息熵的搜索方法及其设备
CN102081625A (zh) 一种数据查询的方法及查询服务器
US9342600B1 (en) Populating query suggestion database using chains of related search queries
CN103309894B (zh) 基于用户属性的搜索实现方法及系统
CN103106585A (zh) 产品信息的实时去重方法和装置
CN105468651A (zh) 一种关系数据库数据查询方法及系统
US20040267553A1 (en) Evaluating storage options
CN105302867A (zh) 一种搜索引擎查询方法及装置
CN113515545B (zh) 数据查询方法、装置、系统、电子设备以及存储介质
CN106383830A (zh) 一种数据检索方法及设备
CN105354193A (zh) 数据库数据缓存方法、查询方法及缓存装置、查询装置
Sladescu et al. Event aware workload prediction: A study using auction events
US20150220648A1 (en) Systems and Methods for Performing Machine-Implemented Tasks
CN104978670A (zh) 一种用于呈现多个指标的数据信息的方法和装置
US9665636B2 (en) Data partioning based on end user behavior
WO2019019596A1 (zh) 断点名单的处理方法、装置、服务器及介质
CN110084476B (zh) 案件调整方法、装置、计算机设备和存储介质
US7822748B2 (en) Method and system for delivering information with caching based on interest and significance

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant