CN104216901A - 信息搜索的方法和系统 - Google Patents

信息搜索的方法和系统 Download PDF

Info

Publication number
CN104216901A
CN104216901A CN201310214894.XA CN201310214894A CN104216901A CN 104216901 A CN104216901 A CN 104216901A CN 201310214894 A CN201310214894 A CN 201310214894A CN 104216901 A CN104216901 A CN 104216901A
Authority
CN
China
Prior art keywords
search
condition
data
information
search condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310214894.XA
Other languages
English (en)
Other versions
CN104216901B (zh
Inventor
康彦霞
田旭东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Feinno Communication Technology Co Ltd
Original Assignee
Beijing Feinno Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Feinno Communication Technology Co Ltd filed Critical Beijing Feinno Communication Technology Co Ltd
Priority to CN201310214894.XA priority Critical patent/CN104216901B/zh
Publication of CN104216901A publication Critical patent/CN104216901A/zh
Application granted granted Critical
Publication of CN104216901B publication Critical patent/CN104216901B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24554Unary operations; Data partitioning operations
    • G06F16/24556Aggregation; Duplicate elimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种信息搜索的方法和系统,属于互联网技术领域。所述方法包括:客户端接收用户发送的搜索请求,对搜索请求进行解析获取搜索条件,并将所述搜索条件发送给服务器端,搜索条件包括:关键字和搜索时间条件;服务器端根据所述搜索条件在目标数据库中搜索,得到满足搜索条件的信息,并将满足搜索条件的信息写入到临时表中,目标数据库中包括多张目标数据表,每张目标数据表是以天为单位建立的数据表,每张目标数据表中的数据满足预设条件;客户端从临时表中获取满足搜索条件的信息,并输出满足搜索条件的信息。本发明从抽取出的目标数据表中进行搜索,这样不仅提高了搜索的准确率,也提高了搜索的效率。

Description

信息搜索的方法和系统
技术领域
本发明涉及互联网技术领域,特别涉及一种信息搜索的方法和系统。
背景技术
随着互联网的发展,不同的运营商推出了各种网络产品以吸引更多的用户。随着互联网用户的增多,互联网上产生的消息也越来越多,这些消息中可能涉及到政治敏感词汇或是涉密信息,所以如何保证良好的网络环境是需要解决的问题。
目前有一种内容审核系统,运营商可以通过该系统对产品使用过程中产生的消息进行审核。具体的,在后台维护两张表,表1存放产品使用过程中产生的数据的基本信息,表2存放数据的内容。表1和表2通过数据ID关联,表1中一条数据ID对应表2中的多行。当运营商需要进行内容审核时,在客户端上输入搜索关键字,然后对表2进行全文搜索,从而得到需要审核的信息,进一步进行审核。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
目前内容审核系统的搜索关键字的内容都存放在一个字段中,该字段中的有些内容是需要搜索的,也有些内容是不需要搜索的,但现有的全文搜索技术不能对这些内容进行区分,比如搜索关键字‘abc’时,要求返回包括该关键字的标题、内容和昵称,但用现有的全文搜索技术进行关键字搜索的时候,除了包含该关键字的标题、内容和昵称会被搜索出来之外,还会搜索出一些干扰信息,比如包含关键字的链接地址也会被搜索出来,这样就会导致搜索的结果就不准确,也降低了搜索效率。
发明内容
为了解决现有全文搜索不准确、搜索效率低的问题,本发明实施例中提供了一种信息搜索的方法和系统。所述技术方案如下:
一方面,提供了一种信息搜索的方法,所述方法包括:
客户端接收用户发送的搜索请求,对所述搜索请求进行解析获取搜索条件,并将所述搜索条件发送给服务器端,其中,所述搜索条件包括:关键字和搜索时间条件;
所述服务器端根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,并将所述满足所述搜索条件的信息写入到临时表中,其中,所述目标数据库中包括多张目标数据表,所述每张目标数据表是以天为单位建立的数据表,所述每张目标数据表中的数据满足预设条件;
所述客户端从所述临时表中获取满足所述搜索条件的信息,并输出所述满足所述搜索条件的信息。
所述客户端接收用户发送的搜索请求之前,还包括:
服务器端根据预设条件对源数据表中的数据进行抽取,并将所述抽取出来的数据存储到目标数据表,其中,所述预设条件包括:数据来源、数据作者和文本内容。
所述服务器端根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,包括:
所述服务器端根据所述搜索时间条件判断是否只搜索一天的数据,如果是,则在目标数据库中搜索所述搜索时间条件对应的目标数据表,并在所述搜索时间条件对应的目标数据表中搜索所述关键字,得到满足所述搜索条件的信息,如果否,则在所述目标数据库中搜索所述搜索时间条件对应的多张目标数据表,并将所述搜索时间条件对应的多张目标数据表中的数据进行联合,得到联合后的搜索时间段的表,在所述联合后的搜索时间段的表中搜索所述关键字,得到满足所述搜索条件的信息。
所述客户端从所述临时表中获取满足所述搜索条件的信息,并输出满足所述搜索条件的信息,包括:
所述客户端从所述临时表中分页加载满足所述搜索条件的信息,并输出满足所述搜索条件的信息。
所述方法还包括:
所述服务器端对所述目标数据表中的数据进行监控,当发现有超出预设期限的数据时,删除超出所述预设期限的数据。
另一方面,还提供了一种信息搜索的系统,所述系统包括:客户端和服务器端;
所述客户端,用于接收用户发送的搜索请求,对所述搜索请求进行解析获取搜索条件,并将所述搜索条件发送给服务器端,其中,所述搜索条件包括:关键字和搜索时间条件;
所述服务器端,用于根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,并将所述满足所述搜索条件的信息写入到临时表中,其中,所述目标数据库中包括多张目标数据表,所述每张目标数据表是以天为单位建立的数据表,所述每张目标数据表中的数据满足预设条件;
所述客户端还用于从所述临时表中获取满足所述搜索条件的信息,并输出所述满足所述搜索条件的信息。
所述客户端接收用户发送的搜索请求之前,还包括:
所述服务器端根据预设条件对源数据表中的数据进行抽取,并将所述抽取出来的数据存储到目标数据表,其中,所述预设条件包括:数据来源、数据作者和文本内容。
所述服务器端具体用于:
根据所述搜索时间条件判断是否只搜索一天的数据,如果是,则在目标数据库中搜索所述搜索时间条件对应的目标数据表,并在所述搜索时间条件对应的目标数据表中搜索所述关键字,得到满足所述搜索条件的信息,如果否,则在所述目标数据库中搜索所述搜索时间条件对应的多张目标数据表,并将所述搜索时间条件对应的多张目标数据表中的数据进行联合,得到联合后的搜索时间段的表,在所述联合后的搜索时间段的表中搜索所述关键字,得到满足所述搜索条件的信息。
所述客户端具体用于:
从所述临时表中分页加载满足所述搜索条件的信息,并输出满足所述搜索条件的信息。
所述服务器端还用于对所述目标数据表中的数据进行监控,当发现有超出预设期限的数据时,删除超出所述预设期限的数据。
本发明实施例提供的技术方案带来的有益效果是:在内容审核系统中加入搜索时间条件限制,且从抽取出的目标数据库中进行搜索,由于目标数据库中包括多张以天为单位建立目标数据表,且目标数据表中的数据满足预设条件,所以在对关键字进行搜索时更有针对性,这样不仅提高了搜索的准确率,也提高了搜索的效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一中提供的一种信息搜索的方法流程图;
图2是本发明实施例二中提供的一种信息搜索的方法流程图;
图3是本发明实施例三中提供的一种信息搜索的系统示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
实施例一
参见图1,本实施例中提供了一种信息搜索的方法,包括:
101、客户端接收用户发送的搜索请求,对所述搜索请求进行解析获取搜索条件,并将所述搜索条件发送给服务器端,其中,所述搜索条件包括:关键字和搜索时间条件;
102、所述服务器端根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,并将所述满足所述搜索条件的信息写入到临时表中,其中,所述目标数据库中包括多张目标数据表,所述每张目标数据表是以天为单位建立的数据表,所述每张目标数据表中的数据满足预设条件;
103、所述客户端从所述临时表中获取满足所述搜索条件的信息,并输出满足所述搜索条件的信息。
在另一实施例中,所述客户端接收用户发送的搜索请求之前,还包括:
服务器端根据预设条件对源数据表中的数据进行抽取,并将所述抽取出来的数据存储到目标数据表,其中,所述预设条件包括:数据来源、数据作者和文本内容。
在另一实施例中,所述服务器端根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,包括:
所述服务器端根据所述搜索时间条件判断是否只搜索一天的数据,如果是,则在目标数据库中搜索所述搜索时间条件对应的目标数据表,并在所述搜索时间条件对应的目标数据表中搜索所述关键字,得到满足所述搜索条件的信息,如果否,则在所述目标数据库中搜索所述搜索时间条件对应的多张目标数据表,并将所述搜索时间条件对应的多张目标数据表中的数据进行联合,得到联合后的搜索时间段的表,在所述联合后的搜索时间段的表中搜索所述关键字,得到满足所述搜索条件的信息。
在另一实施例中,所述客户端从所述临时表中获取满足所述搜索条件的信息,并输出满足所述搜索条件的信息,包括:
所述客户端从所述临时表中分页加载满足所述搜索条件的信息,并输出满足所述搜索条件的信息。
在另一实施例中,所述方法还包括:
所述服务器端对所述目标数据表中的数据进行监控,当发现有超出预设期限的数据时,删除超出所述预设期限的数据。
本实施例的有益效果包括:在内容审核系统中加入搜索时间条件限制,且从抽取出的目标数据库中进行搜索,由于目标数据库中包括多张以天为单位建立目标数据表,且目标数据表中的数据满足预设条件,所以在对关键字进行搜索时更有针对性,这样不仅提高了搜索的准确率,也提高了搜索的效率。
实施例二
本发明实施例中提供了一种信息搜索的方法,从原始数据库中将需要的数据提取出来建立新的目标数据库,使用新的目标数据库进行信息搜索,并将搜索结果放入临时表中,方便客户端分页加载显示。其中,在目标数据库中组建多张一天为单位建立的目标数据表,这样在获得搜索时间条件后,就可以直接从目标数据库中搜索该搜索时间条件对应的目标数据表,然后再进一步根据关键字进行搜索,以提高搜索效率。参见图2,方法流程包括:
201、服务器端根据预设条件对源数据表进行抽取,并根据所述抽取出来的数据组建目标数据表。
本实施例中,在服务器端仍然维护着现有的两张表,如表1和表2所示:
表1
表2
其中,表1存放产品使用过程中产生的数据的基本信息,表2存放数据的内容,表1和表2通过数据ID关联,表1中一条数据ID对应表2中的多行。其中,表2中的DataType可以至少包括7种不同的数据类型,如Id、Source-来源、Author-作者、Text-文本内容、Video-视频、Photo-图片、bookmark-书签。
表2中插入数据非常频繁,大概是每分钟3千到4千条,通过服务器批量插入,如果一旦因为频繁查询或者更新索引,导致该表处理速度慢,则会产生因插入超时,而丢失数据的情况,也就无法对丢失的数据进行审核。此外,本实施例中,对关键字的搜索需求进行统计,获得被搜索次数比较多的数据类型,如Source-来源,Author-作者和Text-文本内容,因此本实施例中将该被搜索次数比较多的数据类型作为预设条件,对表2进行有针对性的数据抽取,以建立新的数据表,在搜索时对新的数据表进行搜索,这样可以既减少了搜索面积,又提高了搜索的准确性。其中新的数据表中存储着该被搜索次数比较多的数据类型对应的数据。
为了方便描述,将表2称作源数据表,新建的数据表称作目标数据表。具体执行过程中,新增一个目标数据库AUDITSearchDB,在该数据库中按天建立多张目标数据表,每隔预设时间将表2中的数据同步到AUDITSearchDB中,因为目标数据表是按照天建立的,因此目标数据表中只需要两列(DataId和DataValue)即可,其他无关列忽略。预设时间可以是一分钟,两分钟,五分钟等,对此本实施例中并不做具体限定。
其中,将表2中的数据同步到AUDITSearchDB中,包括:将当天被搜索次数比较多的数据类型作为抽取条件,对原始数据库的源数据表进行抽取,获得抽取数据,并将抽取出来的数据存储到AUDITSearchDB中的目标数据表中实现数据同步,其中,预设条件包括但不限于:数据来源、数据作者和文本内容等。如表3所示建立的目标数据表:
表3
列名 数据类型 注释
DataId bigint 数据Id
DataValue nvarchar(max) 字段值
值得说明的是,在建立新的AUDITSearchDB后,服务器端对目标数据表中的数据进行监控,当发现有超出预设期限的数据时,删除超出所述预设期限的数据。其中,预设期限是指与当前时间的距离,如预设期限为15天,一个月,或是3个月,如果超出这个期限,则删除在当天时间之前15天、一个月或是3个月的数据,以保证数据的时效性。
202、客户端接收用户发送的搜索请求,对所述搜索请求进行解析获取搜索条件,并将所述搜索条件发送给服务器端。
本步骤中,搜索条件包括但不限于:关键字和搜索时间条件等。其中,在内容审核系统上设置搜索的时间条件,并将该条件作为必选项,这样当用户需要进行搜索时,必须选择此项才能进行搜索。具体执行过程中,可以提供多个时间条件供用户选择,如时间条件包括:当天、三号(对应当月的三号,例如3月3号)、五号(对应当月的五号)、三天内、五天内、一个星期内或是一个月内等,对此本实施例中并不做具体限定。当然也可以给用户提供输入接口,用户可以在该输入接口上输入自己需要搜索的时间条件,对此本实施例中并不做具体限定。
客户端在获取到用户的搜索请求后,对其进行分析,提取出其中包括的关键字和搜索时间条件,其中具体分析过程与现有技术类似,本实施例中不再赘述。
203、服务器端根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,并将所述满足所述搜索条件的信息写入到临时表中。
本步骤中优选地,根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,包括:服务器端根据所述搜索时间条件判断是否只搜索一天的数据,如果是,则在目标数据库中搜索所述搜索时间条件对应的目标数据表,并在所述搜索时间条件对应的目标数据表中搜索所述关键字,得到满足所述搜索条件的信息,如果否,则在所述目标数据库中搜索所述搜索时间条件对应的多张目标数据表,并将所述搜索时间条件对应的多张目标数据表中的数据进行联合,得到联合后的搜索时间段的表,在所述联合后的搜索时间段的表中搜索所述关键字,得到满足所述搜索条件的信息。
例如,如果用户选择的搜索时间条件为当天,则只需要搜索当天对应的目标数据表,如果用户选择的时间条件为三号,则获取三号对应的目标数据表,在该目标数据表中对关键字进行搜索,得到搜索结果集。如果用户选择的时间条件为三天内,假如当天为5号,则合并3号、4号和5号三天对应目标数据表中的数据,得到联合搜索时间段的表,然后根据该搜索页面时间条件在该联合搜索时间段的表中进行搜索,得到搜索结果集。
进一步地,在获得满足搜索条件的结果后,将该结果插入到AUDITSearchDB的临时表中,以便用户分页加载。
204、客户端从所述临时表中获取满足所述搜索条件的信息,并输出满足所述搜索条件的信息。
本步骤中,为方便查看搜索的结果,客户端从所述临时表中分页加载满足所述搜索条件的信息,并输出满足所述搜索条件的信息,以在客户端展示搜索结果。
本实施例中,为了方便用户查看查询结果,客户端采用分页加载的方式,且为避免在翻页的时候再次查询,本实施例中采用将查询结果写入临时表的方式,这样翻页的时候查询结果就能直接从该临时表中查看,大幅提升了分页加载速度。
本实施例的有益效果包括:在内容审核系统中加入搜索时间条件限制,且从抽取出的目标数据库中进行搜索,由于目标数据库中包括多张以天为单位建立目标数据表,且目标数据表中的数据满足预设条件,所以在对关键字进行搜索时更有针对性,这样不仅提高了搜索的准确率,也提高了搜索的效率。且目标数据表以天为单位建立,一旦出现过期数据,则可将过期数据表直接删除,维护简单。本实施例中采用将查询结果写入临时表的方式,这样翻页的时候查询结果就能直接从该临时表中查看,大幅提升了分页加载速度。
实施例三
参见图3,本发明实施例中提供了一种信息搜索的系统,包括:客户端300和服务器端400;
所述客户端300,用于接收用户发送的搜索请求,对所述搜索请求进行解析获取搜索条件,并将所述搜索条件发送给服务器端,其中,所述搜索条件包括:关键字和搜索时间条件;
所述服务器端400,用于根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,并将所述满足所述搜索条件的信息写入到临时表中,其中,所述目标数据库中包括多张目标数据表,所述每张目标数据表是以天为单位建立的数据表,所述每张目标数据表中的数据满足预设条件;
所述客户端还用于从所述临时表中获取满足所述搜索条件的信息,并输出满足所述搜索条件的信息。
在另一实施例中,所述客户端300接收用户发送的搜索请求之前,所述服务器端400还用于根据预设条件对源数据表中的数据进行抽取,并将所述抽取出来的数据存储到目标数据表,其中,所述预设条件包括:数据来源、数据作者和文本内容。
在另一实施例中,所述服务器端400根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,包括:
所述服务器端400根据所述搜索时间条件判断是否只搜索一天的数据,如果是,则在目标数据库中搜索所述搜索时间条件对应的目标数据表,并在所述搜索时间条件对应的目标数据表中搜索所述关键字,得到满足所述搜索条件的信息,如果否,则在所述目标数据库中搜索所述搜索时间条件对应的多张目标数据表,并将所述搜索时间条件对应的多张目标数据表中的数据进行联合,得到联合后的搜索时间段的表,在所述联合后的搜索时间段的表中搜索所述关键字,得到满足所述搜索条件的信息。
在另一实施例中,所述客户端300从所述临时表中获取满足所述搜索条件的信息,并输出满足所述搜索条件的信息,包括:
所述客户端300从所述临时表中分页加载满足所述搜索条件的信息,并输出满足所述搜索条件的信息。
在另一实施例中,所述服务器端400还用于对所述目标数据表中的数据进行监控,当发现有超出预设期限的数据时,删除超出所述预设期限的数据。
本实施例的有益效果包括:在内容审核系统中加入搜索时间条件限制,且从抽取出的目标数据库中进行搜索,由于目标数据库中包括多张以天为单位建立目标数据表,且目标数据表中的数据满足预设条件,所以在对关键字进行搜索时更有针对性,这样不仅提高了搜索的准确率,也提高了搜索的效率。
需要说明的是:上述实施例提供的信息搜索的系统,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将系统的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
另外,上述实施例提供的信息搜索的系统与信息搜索的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种信息搜索的方法,其特征在于,所述方法包括:
客户端接收用户发送的搜索请求,对所述搜索请求进行解析获取搜索条件,并将所述搜索条件发送给服务器端,其中,所述搜索条件包括:关键字和搜索时间条件;
所述服务器端根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,并将所述满足所述搜索条件的信息写入到临时表中,其中,所述目标数据库中包括多张目标数据表,每张所述目标数据表是以天为单位建立的数据表,每张所述目标数据表中的数据满足预设条件;
所述客户端从所述临时表中获取满足所述搜索条件的信息,并输出所述满足所述搜索条件的信息。
2.根据权利要求1所述的方法,其特征在于,所述客户端接收用户发送的搜索请求之前,还包括:
所述服务器端根据预设条件对源数据表中的数据进行抽取,并将所述抽取出来的数据存储到目标数据表,其中,所述预设条件包括:数据来源、数据作者和文本内容。
3.根据权利要求1所述的方法,其特征在于,所述服务器端根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,包括:
所述服务器端根据所述搜索时间条件判断是否只搜索一天的数据,如果是,则在目标数据库中搜索所述搜索时间条件对应的目标数据表,并在所述搜索时间条件对应的目标数据表中搜索所述关键字,得到满足所述搜索条件的信息,如果否,则在所述目标数据库中搜索所述搜索时间条件对应的多张目标数据表,并将所述搜索时间条件对应的多张目标数据表中的数据进行联合,得到联合后的搜索时间段的表,在所述联合后的搜索时间段的表中搜索所述关键字,得到满足所述搜索条件的信息。
4.根据权利要求1所述的方法,其特征在于,所述客户端从所述临时表中获取满足所述搜索条件的信息,并输出满足所述搜索条件的信息,包括:
所述客户端从所述临时表中分页加载满足所述搜索条件的信息,并输出满足所述搜索条件的信息。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
所述服务器端对所述目标数据表中的数据进行监控,当发现有超出预设期限的数据时,删除超出所述预设期限的数据。
6.一种信息搜索的系统,其特征在于,所述系统包括:客户端和服务器端;
所述客户端,用于接收用户发送的搜索请求,对所述搜索请求进行解析获取搜索条件,并将所述搜索条件发送给服务器端,其中,所述搜索条件包括:关键字和搜索时间条件;
所述服务器端,用于根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,并将所述满足所述搜索条件的信息写入到临时表中,其中,所述目标数据库中包括多张目标数据表,所述每张目标数据表是以天为单位建立的数据表,所述每张目标数据表中的数据满足预设条件;
所述客户端还用于从所述临时表中获取满足所述搜索条件的信息,并输出所述满足所述搜索条件的信息。
7.根据权利要求6所述的系统,其特征在于,所述客户端接收用户发送的搜索请求之前,
所述服务器端还用于根据预设条件对源数据表中的数据进行抽取,并将所述抽取出来的数据存储到目标数据表,其中,所述预设条件包括:数据来源、数据作者和文本内容。
8.根据权利要求6所述的系统,其特征在于,所述服务器端具体用于:
根据所述搜索时间条件判断是否只搜索一天的数据,如果是,则在目标数据库中搜索所述搜索时间条件对应的目标数据表,并在所述搜索时间条件对应的目标数据表中搜索所述关键字,得到满足所述搜索条件的信息,如果否,则在所述目标数据库中搜索所述搜索时间条件对应的多张目标数据表,并将所述搜索时间条件对应的多张目标数据表中的数据进行联合,得到联合后的搜索时间段的表,在所述联合后的搜索时间段的表中搜索所述关键字,得到满足所述搜索条件的信息。
9.根据权利要求6所述的系统,其特征在于,所述客户端具体用于:
从所述临时表中分页加载满足所述搜索条件的信息,并输出满足所述搜索条件的信息。
10.根据权利要求6所述的系统,其特征在于,
所述服务器端还用于对所述目标数据表中的数据进行监控,当发现有超出预设期限的数据时,删除超出所述预设期限的数据。
CN201310214894.XA 2013-05-31 2013-05-31 信息搜索的方法和系统 Active CN104216901B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310214894.XA CN104216901B (zh) 2013-05-31 2013-05-31 信息搜索的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310214894.XA CN104216901B (zh) 2013-05-31 2013-05-31 信息搜索的方法和系统

Publications (2)

Publication Number Publication Date
CN104216901A true CN104216901A (zh) 2014-12-17
CN104216901B CN104216901B (zh) 2017-12-05

Family

ID=52098404

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310214894.XA Active CN104216901B (zh) 2013-05-31 2013-05-31 信息搜索的方法和系统

Country Status (1)

Country Link
CN (1) CN104216901B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105787029A (zh) * 2016-02-25 2016-07-20 浪潮软件集团有限公司 一种基于solr的关键字词识别办法
CN107609180A (zh) * 2017-09-29 2018-01-19 努比亚技术有限公司 一种筛选方法、终端及存储介质
CN108268515A (zh) * 2016-12-30 2018-07-10 北京国双科技有限公司 聚合表维度的选择方法和装置
CN111176650A (zh) * 2018-11-09 2020-05-19 阿里巴巴集团控股有限公司 解析器生成方法、检索方法、服务器及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040133538A1 (en) * 2002-12-23 2004-07-08 Amiri Khalil S. Transparent edge-of-network data cache
CN101110088A (zh) * 2007-04-17 2008-01-23 南京中兴软创科技有限责任公司 基于缓存技术的数据库访问接口方法
CN101604334A (zh) * 2008-11-18 2009-12-16 北京美智医疗科技有限公司 一种基于缓存技术的医疗影像数据库检索方法及检索系统
CN101789878A (zh) * 2009-12-30 2010-07-28 中兴通讯股份有限公司 网管性能数据的处理方法及装置
CN102117309A (zh) * 2010-01-06 2011-07-06 卓望数码技术(深圳)有限公司 一种数据缓存系统和数据查询方法
CN102722508A (zh) * 2011-09-28 2012-10-10 新奥特(北京)视频技术有限公司 一种现场数据库提取技术统计的方法及系统
CN102737133A (zh) * 2012-06-27 2012-10-17 北京城市网邻信息技术有限公司 一种实时搜索的方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040133538A1 (en) * 2002-12-23 2004-07-08 Amiri Khalil S. Transparent edge-of-network data cache
CN101110088A (zh) * 2007-04-17 2008-01-23 南京中兴软创科技有限责任公司 基于缓存技术的数据库访问接口方法
CN101604334A (zh) * 2008-11-18 2009-12-16 北京美智医疗科技有限公司 一种基于缓存技术的医疗影像数据库检索方法及检索系统
CN101789878A (zh) * 2009-12-30 2010-07-28 中兴通讯股份有限公司 网管性能数据的处理方法及装置
CN102117309A (zh) * 2010-01-06 2011-07-06 卓望数码技术(深圳)有限公司 一种数据缓存系统和数据查询方法
CN102722508A (zh) * 2011-09-28 2012-10-10 新奥特(北京)视频技术有限公司 一种现场数据库提取技术统计的方法及系统
CN102737133A (zh) * 2012-06-27 2012-10-17 北京城市网邻信息技术有限公司 一种实时搜索的方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105787029A (zh) * 2016-02-25 2016-07-20 浪潮软件集团有限公司 一种基于solr的关键字词识别办法
CN108268515A (zh) * 2016-12-30 2018-07-10 北京国双科技有限公司 聚合表维度的选择方法和装置
CN108268515B (zh) * 2016-12-30 2020-07-31 北京国双科技有限公司 聚合表维度的选择方法和装置
CN107609180A (zh) * 2017-09-29 2018-01-19 努比亚技术有限公司 一种筛选方法、终端及存储介质
CN107609180B (zh) * 2017-09-29 2020-10-30 浙江佩鼎大数据科技有限公司 一种筛选方法、终端及存储介质
CN111176650A (zh) * 2018-11-09 2020-05-19 阿里巴巴集团控股有限公司 解析器生成方法、检索方法、服务器及存储介质
CN111176650B (zh) * 2018-11-09 2023-04-18 阿里巴巴集团控股有限公司 解析器生成方法、检索方法、服务器及存储介质

Also Published As

Publication number Publication date
CN104216901B (zh) 2017-12-05

Similar Documents

Publication Publication Date Title
CN105447184B (zh) 信息抓取方法及装置
US10963513B2 (en) Data system and method
Mühleisen et al. Web Data Commons-Extracting Structured Data from Two Large Web Corpora.
CN103546326B (zh) 一种网站流量统计的方法
CN105468605A (zh) 一种实体信息图谱生成方法及装置
US20140358889A1 (en) Natural language search results for intent queries
US20120323627A1 (en) Real-time Monitoring of Public Sentiment
CN104899268A (zh) 一种分布式企业信息垂直搜索方法
CN107657057A (zh) 一种企业征信信息融合图形化方法
CN111899089A (zh) 基于知识图谱的企业风险预警方法及系统
CN110928903B (zh) 数据提取方法及装置、设备和存储介质
Feng et al. Patent text mining and informetric-based patent technology morphological analysis: an empirical study
US20150074101A1 (en) Smart search refinement
DE102006040208A1 (de) Patentbezogenes Suchverfahren und -system
CN105335487A (zh) 基于农业技术信息本体库的农业专家信息检索系统及方法
CN103617174A (zh) 一种基于云计算的分布式搜索方法
CN103530429A (zh) 一种网页正文抽取的方法
CN108959580A (zh) 一种标签数据的优化方法及系统
CN104216901A (zh) 信息搜索的方法和系统
Maciołek et al. Cluo: Web-scale text mining system for open source intelligence purposes
CN109101512B (zh) 法律数据库的构建方法、法律数据查询方法及装置
CN104731908A (zh) 一种基于etl的数据清洗方法
CN113407678A (zh) 知识图谱构建方法、装置和设备
CN102890708A (zh) 图书馆采访决策辅助支持系统
Laender et al. Ciência Brasil-the brazilian portal of science and technology

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder

Address after: Room 810, 8 / F, 34 Haidian Street, Haidian District, Beijing 100080

Patentee after: BEIJING D-MEDIA COMMUNICATION TECHNOLOGY Co.,Ltd.

Address before: 100089 Beijing city Haidian District wanquanzhuang Road No. 28 Wanliu new building block A room 602

Patentee before: BEIJING D-MEDIA COMMUNICATION TECHNOLOGY Co.,Ltd.

CP02 Change in the address of a patent holder