CN101154229A - 基于关键字和分类共享的搜索方法和系统 - Google Patents

基于关键字和分类共享的搜索方法和系统 Download PDF

Info

Publication number
CN101154229A
CN101154229A CNA2006101596879A CN200610159687A CN101154229A CN 101154229 A CN101154229 A CN 101154229A CN A2006101596879 A CNA2006101596879 A CN A2006101596879A CN 200610159687 A CN200610159687 A CN 200610159687A CN 101154229 A CN101154229 A CN 101154229A
Authority
CN
China
Prior art keywords
resource description
server
user
user terminal
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006101596879A
Other languages
English (en)
Other versions
CN100561477C (zh
Inventor
黄景楠
罗予晋
范昂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CNB2006101596879A priority Critical patent/CN100561477C/zh
Publication of CN101154229A publication Critical patent/CN101154229A/zh
Application granted granted Critical
Publication of CN100561477C publication Critical patent/CN100561477C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

公开了一种基于关键字和分类共享的搜索方法和系统,所述方法包括:从用户终端向服务器请求与预定的关键字相关的内容,所述内容在服务器中是用预定格式的资源描述表示的;从服务器向用户终端发送与所述关键词相关的资源描述;以及用户终端基于服务器所发送的资源描述获取与预定的关键词相关的内容;其中所述资源描述是由服务器通过归并预先从多个用户终端提供的、共享的应用资源的资源描述而产生的。由于各种信息是预先在用户端被分类并与其他用户共享,使得某一领域的各个用户能够彼此协作,从大量的信息中准确地获取想要的信息。

Description

基于关键字和分类共享的搜索方法和系统
技术领域
本发明涉及网络信息搜索,具体涉及一种基于关键字和分类共享的搜索系统和方法,它能够最大限度地通过网络用户之间的协作来对共享信息进行搜索,从而快速发现想要的准确信息。
背景技术
随着互联网的发展,网络上的数据越来越多。因此,出现了各种各样的搜索引擎,供终端用户从网络上搜索所需的信息。现有的搜索引擎,如google.com,baidu.com等都能够快速的根据用户的输入给出匹配的记录。但是,由于网络上的信息量巨大,用户难以快速的发现所需要的准确信息。
另外,百度的‘知道’和新浪的‘爱问’通过用户提问/其他用户解答的方式来解决用户获取准确信息的难题。这样的服务模式一定程度上解决了准确搜索的问题,但其存在至少两个缺点。一个缺点是交互的非即时性,也就是用户输入一个问题后,可能需要等待很长时间才能知道答案。另一个缺点是问答形式的信息记录未经过任何整理,用户在使用时大都通过输入关键字的方式来查询已经存在的问答信息。因此,在信息量大的情况下,用户还是难以快速获得所需要的信息。
实际上,很多用户都对某个领域的信息感兴趣,但他们却不能吸收已经有的前人的信息搜集的基础。也就是,虽然每个人的搜索目的大致相同,但都是各自封闭式的利用各种现在的搜索方法进行从头开始的搜索。这导致出现了一种新的信息孤岛,因为人们难以通过有效协作来更快更好地得到自己需要的信息。
美国专利US2005027694以及国际专利公开WO9849637提出了一种在大量信息的情况下进行搜索的方法,其中,搜索引擎在接到用户的查询输入后,将匹配的结果进行分类,以便于用户通过类别的导航得到所要得信息。这种搜索方法是对Google.com,baidu.com等搜索引擎的一种改进,但是其存在的弊端在于这种分类的方法是由后台服务控制的,而目前如何通过计算机自动地将信息分类的技术虽然很多,但是它们的效果都达不到真正的自然语言理解。因此,这种搜索方法的效果并不理想。
随着Web2.0的技术/应用模式的发展,互联网上的用户越来越习惯于通过网络进行信息的共享和协作。所以,需要开发一种能够充分利用用户之间的协作来搜索共享信息的方法。
发明内容
鉴于上述问题,提出了本发明。本发明的目的在于通过利用众多互联网用户的相互协作,以共享关键字+分类的方式来解决用户共享个人经过整理后的数据,从而使得其他用户能够快速查找到所需要的并且具有便于用户认知的结构的数据。
在本发明的一个方面,提出了一种搜索方法,包括:从用户终端向服务器请求与预定的关键字相关的内容,所述内容在服务器中是用预定格式的资源描述表示的;从服务器向用户终端发送与所述关键词相关的资源描述;以及用户终端基于服务器所发送的资源描述获取与预定的关键词相关的内容;其中所述资源描述是由服务器通过归并预先从多个用户终端提供的、共享的应用资源的资源描述而产生的。
此外,根据本发明的实施例,该方法还包括:在服务器收到与该关键词相关的、新的资源描述并进行了新的归并后,向用户终端发送新归并产生的资源描述。
此外,根据本发明的实施例,该方法还包括:在预定的时间过去之后,服务器停止向用户终端发送所请求的内容的资源描述。
此外,根据本发明的实施例,所述资源描述中至少包括关键字和类别。
此外,根据本发明的实施例,所述服务器按照相同关键字的资源描述中的类别的相似度来进行归并。
此外,根据本发明的实施例,所述服务器还向用户终端发送提交该关键字的资源描述的用户的排名信息。
此外,根据本发明的实施例,所述服务器还向用户终端发送提交该关键字的资源描述的用户的联系方式。
在本发明的另一方面,提出了一种搜索系统,包括:多个用户终端,用于分别在网络上提供共享的应用资源的资源描述;服务器,包括:信息处理装置,通过网络接收所述资源描述,并对相同关键字的资源描述进行归并;数据库,存储各个关键字的归并后的资源描述。
此外,根据本发明的实施例,从多个用户终端中的至少之一向服务器请求预定关键字的关键字相关的内容,以及从服务器向该用户终端发送与所述关键词相关的资源描述,该用户终端基于所述资源描述获取与预定的关键词相关的内容。
利用本发明的上述方法和结构,由于各种信息是预先在用户端被分类并与其他用户共享,使得某一领域的各个用户能够彼此协作,从大量的信息中准确地获取想要的信息。
另外,本发明的方案允许用户在第一次搜索之后,就随着时间的流逝不断地从服务器收到有关搜索的关键词的信息,使得用户能够在一段时间内获得某个领域的相关信息。
另外,经过服务器对用户终端发送的信息进行分类和排名,可以容易地获知在谁是某个领域的专家。这样,当某个用户需要解决某个领域的问题时,可以很容易从该专家获得该问题的答案。
附图说明
通过下面结合附图对发明进行的详细描述,将使本发明的上述特征和优点更加明显,其中:
图1示出了根据本发明实施例的搜索系统的结构示意图;
图2是如图1所示的服务器的结构示意图;
图3是如图1所示的用户终端的结构示意图;以及
图4示出了说明根据本发明实施例的搜索方法的流程图。
具体实施方式
下面,参考附图详细说明本发明的优选实施方式。在附图中,相同的参考标记在不同的附图中表示相同的或相似的组件。为了清楚和简明,包含在这里的已知功能和结构的详细描述将被省略,以避免它们使本发明的主题不清楚。
图1示出了根据本发明实施例的搜索系统的结构示意图。如图1所示,本发明的搜索系统包括:服务器100、网络300和连接在网络300上的多个用户终端210~230。这些用户终端210~230以预定的格式分别对本机和/或网络上的应用资源进行描述,并将应用资源的描述发送到服务器100。
服务器100接收到各个用户终端210~230的资源描述,按照关键字匹配的方法归并各个关键字的分类方式,作为该关键字的最终分类方式,并在某个用户搜索该关键字时,以最终分类方式归并出来的分类提供给用户终端。作为一个实施例,上述的描述格式为:资源所属的关键字/资源所属类别/资源(关键字范围最大,某个关键字下面有若干类别,资源则分属不同的类别)。
下面以用户终端210为例来说明用户终端的构成。图3是如图1所示的用户终端的结构示意图。如图3所示,本发明的用户终端210包括:诸如键盘和鼠标之类的输入单元211;诸如显示器或者打印机之类的输出单元213;网络适配器215,它能够通过网络300与服务器100建立连接,并且通过该连接发送或者接收信息;存储器214,它存储诸如操作系统、浏览器之类的程序和数据;处理器212,它利用存储器214中存储的程序,在用户的操作下将本地和/或网络应用资源按照上述的格式进行描述。
在已经建立了与服务器100之间的连接的情况下,处理器212将这些描述直接发送给服务器100。否则,处理器212暂时将这些描述存储在存储器214中,等到与服务器100建立连接之后,将本地存储的描述发送给服务器100。
在本发明的一个实施例中,从各个用户终端发送给服务器100的应用资源描述可以由用户确定是否共享给其他人。
例如,用户从本地磁盘和网络客户端发现内容,并将内容冠以标签(tag)和分类。例如,用户可以在用户终端210资源管理器中找到其想提交的内容,比如某个文件或者文件夹,选中后经过用户确认是否共享,然后冠以tag并提交给后台。这里,不一定强求进行分类。此外用户可以在浏览器中找到那些相关的URL,选中后经过用户确认是否共享,然后冠以tag。同样,可以分类也可以不分类。
因此,在用户终端210,用户做的主要是找到内容,并进行tag,然后将内容上传给服务器100。当网络断开的时候,处理器212将tag后的内容以及其分类暂时存储在存储器214中,并在网络恢复时,自动上传。
图2是如图1所示的服务器的结构示意图。如图2所示的服务器100包括:用于执行网络通信的网络通信单元130;存储用来对信息进行处理的程序的存储器140;信息处理器120,它根据存储器140中存储的处理程序对通过网络通信单元130接收的、预定格式的应用资源描述进行归并处理,以将彼此之间的相似度超过阈值的分类合并为同一分类;以及数据库110,用于存储由信息处理器120归并后的应用资源分类。在用户搜索某个关键字时,信息处理器120从数据库中检索该关键词,将与该关键词相关的内容以上述归并后的分类的形式呈现给用户。
例如,用户提交各种内容,并在内容上冠以各种不同的tag,如用户A通过用户终端210提交了一批内容,包括文档、代码、ppt、URL,并将这些内容统统冠以一个tag:linux。同时,该用户将linux下的各种内容进行了分类,其分类如下:类别1是文档,类别2是代码。用户B通过用户终端220提交了tag为linux的一组内容,他对该组内容的分类是:类别1为文档、类别2为代码、类别3为人物、类别4为项目。用户C通过用户终端230提交tag为linux的内容的分类分别是:类别1为入门文章、类别2为环境设置、类别3为桌面应用程序。
以上3个用户提交的内容都发到了服务器100后,服务器100判断这些都是linux为tag的内容出现,而且各自有不同的分类,则试图将这些类别进行归并。归并的结果是出现两个聚类中心,最终出现两种分类:分类1为用户B的分类+其他,分类2为用户C的分类+其他,所有的内容都在这些分类中。
用户终端对服务器100的数据库110中存储的感兴趣内容进行订阅。用户通过用户终端210~230可以通过登录网页的方式直接访问服务器100中的内容。
如上所述,服务器中的内容体现为一个个tag,用户点击tag后能够进入到tag里面。tag里面是以该tag为标题的各种内容,包括文件、URL地址等等。随着用户提交的内容的增加,tag里面的内容随时可能会有所增加,因为有其他用户提交内容时,用该tag作为该内容的标题。
该用户如果觉得这个tag里面包含的内容是其感兴趣的,并且想及时了解该tag下有什么新添加的内容,则可以选中该tag点击右键菜单中的订阅选项对该tag的内容进行订阅。
服务器100接收到订阅请求后,会将该tag和该用户关联起来,当该tag下有新的内容添加进来时,如果服务器100检测到该用户现在在线,会将该内容直接推送到该用户的用户终端,并且用户终端会提示用户有推送内容到。
如上所述,如果检测到用户此时没有在线,则等待用户上线后,将该内容推送给用户的用户终端。另外,服务器100可以接受配置,为未上线的用户保留多长时间内容,超过预定的时间则将内容删除。
图4说明根据本发明实施例的搜索方法的流程图。如图4所示,将用户终端210~230上的应用资源进行描述,描述格式为:资源所属的关键字/资源所属类别/资源(关键字范围最大,某个关键字下面有若干类别,资源则分属不同的类别)(S10),并将具有上述结构的描述内容发给网络300上的服务器100(S20)。
该服务器100实时收集网络上各用户终端上传的应用资源描述,如果判断上传内容可以共享,则将描述中的关键字/类别/资源取出,首先基于关键字匹配的方法将所有相同关键字下的分类方式(每一种分类方式含有一个或多个类别)进行相似度分析。当若干个分类方式之间的相似度超出阈值时,那么这些分类方式可以归并成一个并对用户的贡献程度进行排名,该排名可以在用户进行搜索时发送给用户,作为搜索参考之用。这个分类方式继承原先若干分类方式中经过查重处理后所有的内容。如果有的分类方式与其他各分类方式均无相似关系,则该分类方式保留(S30)。
从而,在这个关键字中向用户呈现经过归并处理后的分类方式,并将由最多的分类方式归并出来的分类优先呈现给用户。这种最多的分类方式归并出来的新分类方式我们认为是该关键字所代表的领域的内容最有效的组织方式,对用户最有价值(S40)。
该关键字下的分类方式随着设备新的提交上来的类别/资源的加入,定期或者当有足够多的新数据到来时,进行新一轮的相似度计算和归并,形成新的结果呈现给用户(S50~S70)。
此外,后台服务后台服务在归并关键字/分类/数据的同时,还可以通过用户所共享内容的多少或其他方法对用户贡献度进行评价,那么某个关键字下面除了分类方式和数据外,还能够看到针对某个关键字/分类的用户贡献度排名信息以及这些用户的联系方式,通过这些信息和联系方式,用户可以发现该关键字/该领域的专家从而进行进一步的交流。但是如果提交资源描述的用户不愿意公开其联系方式,则不向用户终端提供这些用户的联系方式。
上面的描述仅用于实现本发明的实施方式,本领域的技术人员应该理解,在不脱离本发明的范围的任何修改或局部替换,均应该属于本发明的权利要求来限定的范围,因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (15)

1.一种搜索方法,包括:
从用户终端向服务器请求与预定的关键字相关的内容,所述内容在服务器中是用预定格式的资源描述表示的;
从服务器向用户终端发送与所述关键词相关的资源描述;以及
用户终端基于服务器所发送的资源描述获取与预定的关键词相关的内容;
其中所述资源描述是由服务器通过归并预先从多个用户终端提供的、共享的应用资源的资源描述而产生的。
2.如权利要求1所述的搜索方法,还包括:
在服务器收到与该关键词相关的、新的资源描述并进行了新的归并后,向用户终端发送新归并产生的资源描述。
3.如权利要求2所述的搜索方法,还包括:
在预定的时间过去之后,服务器停止向用户终端发送所请求的内容的资源描述。
4.如权利要求1所述的搜索方法,其特征在于,所述资源描述中至少包括关键字和类别。
5.如权利要求4所述的搜索方法,其特征在于,所述服务器按照相同关键字的资源描述中的类别的相似度来进行归并。
6.如权利要求1所述的搜索方法,其特征在于,所述服务器还向用户终端发送提交该关键字的资源描述的用户的排名信息。
7.如权利要求6所述的搜索方法,其特征在于,所述服务器还向用户终端发送提交该关键字的资源描述的用户的联系方式。
8.一种搜索系统,包括:
多个用户终端,用于分别在网络上提供共享的应用资源的资源描述;
服务器,包括:
信息处理装置,通过网络接收所述资源描述,并对相同关键字的资源描述进行归并;
数据库,存储各个关键字的归并后的资源描述。
9.如权利要求8所述的搜索系统,其特征在于,从多个用户终端中的至少之一向服务器请求预定关键字的关键字相关的内容,以及从服务器向该用户终端发送与所述关键词相关的资源描述,该用户终端基于所述资源描述获取与预定的关键词相关的内容。
10.如权利要求8所述的搜索系统,其特征在于,
在服务器收到与该关键词相关的、新的资源描述并进行了新的归并后,向该用户终端发送新归并产生的资源描述。
11.如权利要求9所述的搜索系统,其特征在于,
在预定的时间过去之后,服务器停止向该用户终端发送所请求的内容的资源描述。
12.如权利要求9所述的搜索系统,其特征在于,所述资源描述中至少包括关键字和类别。
13.如权利要求12所述的搜索系统,其特征在于,所述服务器按照相同关键字的资源描述中的类别的相似度来进行归并。
14.如权利要求9所述的搜索系统,其特征在于,所述服务器还向该用户终端发送提交该关键字的资源描述的用户的排名信息。
15.如权利要求14所述的搜索系统,其特征在于,所述服务器还向用户终端发送提交该关键字的资源描述的用户的联系方式。
CNB2006101596879A 2006-09-30 2006-09-30 基于关键字和分类共享的搜索方法和系统 Active CN100561477C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006101596879A CN100561477C (zh) 2006-09-30 2006-09-30 基于关键字和分类共享的搜索方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006101596879A CN100561477C (zh) 2006-09-30 2006-09-30 基于关键字和分类共享的搜索方法和系统

Publications (2)

Publication Number Publication Date
CN101154229A true CN101154229A (zh) 2008-04-02
CN100561477C CN100561477C (zh) 2009-11-18

Family

ID=39255890

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006101596879A Active CN100561477C (zh) 2006-09-30 2006-09-30 基于关键字和分类共享的搜索方法和系统

Country Status (1)

Country Link
CN (1) CN100561477C (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101930656A (zh) * 2010-07-30 2010-12-29 武汉虹信通信技术有限责任公司 平安城市视频监控系统告警消息处理方法
CN103020324A (zh) * 2013-01-15 2013-04-03 周万荣 一种基于应用的搜索方法及设备和系统
CN104065562A (zh) * 2014-02-11 2014-09-24 周强 网络信息服务系统中信息即时推送的方法和系统
CN105897924A (zh) * 2009-08-21 2016-08-24 三星电子株式会社 数据发送方法和服务器
CN105975474A (zh) * 2015-03-13 2016-09-28 纳宝株式会社 共享信息的共同关注网络
CN111832851A (zh) * 2019-04-15 2020-10-27 北京嘀嘀无限科技发展有限公司 一种检测方法及装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105897924A (zh) * 2009-08-21 2016-08-24 三星电子株式会社 数据发送方法和服务器
CN101930656A (zh) * 2010-07-30 2010-12-29 武汉虹信通信技术有限责任公司 平安城市视频监控系统告警消息处理方法
CN103020324A (zh) * 2013-01-15 2013-04-03 周万荣 一种基于应用的搜索方法及设备和系统
CN103020324B (zh) * 2013-01-15 2018-10-30 周万荣 一种基于应用的搜索方法及设备和系统
CN104065562A (zh) * 2014-02-11 2014-09-24 周强 网络信息服务系统中信息即时推送的方法和系统
CN105975474A (zh) * 2015-03-13 2016-09-28 纳宝株式会社 共享信息的共同关注网络
CN111832851A (zh) * 2019-04-15 2020-10-27 北京嘀嘀无限科技发展有限公司 一种检测方法及装置
CN111832851B (zh) * 2019-04-15 2024-03-29 北京嘀嘀无限科技发展有限公司 一种检测方法及装置

Also Published As

Publication number Publication date
CN100561477C (zh) 2009-11-18

Similar Documents

Publication Publication Date Title
US11080256B2 (en) Combinators
CN109033387B (zh) 一种融合多源数据的物联网搜索系统、方法及存储介质
EP2438539B1 (en) Co-selected image classification
CN111435344B (zh) 一种基于大数据的钻井提速影响因素分析模型
CN107066529B (zh) 联合团体搜索
US7593981B2 (en) Detection of search behavior based associations between web sites
US20210279232A1 (en) Chatbot Search System, Chatbot Search Method, and Program
CN100561477C (zh) 基于关键字和分类共享的搜索方法和系统
WO2013063327A1 (en) Relevance of name and other search queries with social network features
CN102859516A (zh) 使用历史搜索结果生成改进的文档分类数据
CN102037464A (zh) 具有最多点击的下一个对象的搜索结果
CN104778208A (zh) 一种搜索引擎 seo 网站数据的优化抓取方法及系统
US11423096B2 (en) Method and apparatus for outputting information
CN102214183A (zh) 按页面反馈内容与固定排名相结合的搜索引擎查询方法
KR20150046431A (ko) 효과적인 마케팅을 도출하는 자동학습 시스템 및 방법
JP2009151811A (ja) ホットサイト提示システム
CN102214182A (zh) 一种根据ip地址进行精确查询的搜索方法
CN112989169A (zh) 目标对象识别方法、信息推荐方法、装置、设备及介质
CN108304570B (zh) 一种搜索结果的处理方法及展现方法、服务器、客户端
KR20180050786A (ko) 태그 서칭 기반의 자동 질의 응답 시스템 및 방법
US20150294019A1 (en) Web browsing activity flow
CN107506473B (zh) 一种基于云计算的大数据检索方法
CN102222067A (zh) 一种根据关键字ip地址进行精确查询的搜索方法
KR100906618B1 (ko) 사용자 정의 링크 검색 방법 및 그 시스템
Mahdi et al. A Real Time Visual Exploratory Search Engine for Information Retrieval in a Cloud

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant