CN102298629B - 调整网页排序的搜索结果提供方法及系统 - Google Patents

调整网页排序的搜索结果提供方法及系统 Download PDF

Info

Publication number
CN102298629B
CN102298629B CN201110251430.7A CN201110251430A CN102298629B CN 102298629 B CN102298629 B CN 102298629B CN 201110251430 A CN201110251430 A CN 201110251430A CN 102298629 B CN102298629 B CN 102298629B
Authority
CN
China
Prior art keywords
annotation
item
search
page
web search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110251430.7A
Other languages
English (en)
Other versions
CN102298629A (zh
Inventor
马宇尘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Liangming Technology Development Co Ltd
Original Assignee
Shanghai Liangming Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Liangming Technology Development Co Ltd filed Critical Shanghai Liangming Technology Development Co Ltd
Priority to CN201110251430.7A priority Critical patent/CN102298629B/zh
Publication of CN102298629A publication Critical patent/CN102298629A/zh
Application granted granted Critical
Publication of CN102298629B publication Critical patent/CN102298629B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种调整网页排序的搜索结果提供方法及系统,属于计算机、网络技术领域。该方法包括有如下步骤:步骤1,网络搜索服务器根据客户端的网络路径,采集用户的网络搜索路径信息;步骤2,在用户进行诠释搜索的情况下,采集通过关键信息搜索获得的诠释页面,在该诠释页面中包括有针对于同一主题下两个及两个以上诠释项时,转入下一步骤;步骤3,判断采集获得的网络搜索路径信息与各诠释项之间的关联性,按照关联强度对该页面中的各诠释项进行排序后输出。利用本发明,能够通过用户对网络内容的操作记录,来调整诠释性内容的搜索结果排序方式。

Description

调整网页排序的搜索结果提供方法及系统
技术领域
本发明属于计算机、网络技术领域。
技术背景
目前,各种各样的搜索工具,在网络应用中具有重要的应用价值。因为人们需要通过网络搜索工具来获得各种数据。
其中,当前的搜索工具中,有一类是搜索内容,是针对于用户的网络搜索关键词,查询诠释性内容,而非网络链接。比如,百度百科,维基百科,等等。
针对于同一网络搜索关键词,在同一次搜索所获得的搜索页面中,可能会同时出现两个或两个以上的不同搜索结果。
作为举例,就拿搜索工具www.baidu.com来说,提供有“百度百科”这一诠释性内容搜索功能。用户如果针对于该搜索路径,输入“DC”进行搜索的话,按照2011年6月9日的搜索结果,在同一个页面中一共有31个搜索选项。这些搜索选项都是针对于这一搜索关键词所做出的不同角度的诠释。
而用户想查看的,仅仅是其中一个,具体来说,是“DC”的一个解释“设备描述表(Device Context,DC)”。而该条目的信息内容,在列表排序中,排名为第17位。
诸如此类的搜索结果,在数量多时,会给用户带来不便。
发明内容
本发明的目的,是提供一种调整网页排序的搜索结果提供方法,以及配套的系统,利用本发明,能够通过用户对网络内容的操作记录,来调整诠释性内容的搜索结果排序方式。
本发明提供一种调整网页排序的搜索结果提供方法,该方法包括有如下步骤:
步骤1,网络搜索服务器根据客户端的网络路径,采集用户的网络搜索路径信息;
步骤2,在用户进行诠释搜索的情况下,采集通过关键信息搜索获得的诠释页面,在该诠释页面中包括有针对于同一主题下两个及两个以上诠释项时,转入下一步骤;
步骤3,判断采集获得的网络搜索路径信息与各诠释项之间的关联性,按照关联强度对该页面中的各诠释项进行排序后输出。
进一步,所述的网络路径,是通过记录用户的IP地址和端口号,来进行标识的。
进一步,所述的网络路径,是通过记录用户的MAC地址来进行标识的。
进一步,通过采集用户的登录方式,来获得用户的网络搜索路径信息。
进一步,所述的网络搜索路径信息,包括有网络搜索关键词。
进一步,所述的网络搜索路径信息,包括有用户所点击的网络搜索超链接页面中的内容信息。
进一步,所述的诠释页面中的信息内容,是同一个页面中针对于同一主题的诠释内容项。
进一步,采集获得的诠释页面;
判断所在的页面中,针对于同一网络搜索关键词所获得的诠释项,是否超过两个;
经判断之后,如果只有一个的话,直接将该信息显示,如果包括有两个或者两个以上的话,则进行排序。
进一步,采集诠释项的步骤为,
针对于诠释页面,设定诠释项的内容格式;
遍历用户所浏览网页中的数据内容,判断获得的内容形式中,是否包括有诠释项的内容格式;
在存在诠释项的内容格式的情况下,采集符合诠释项内容格式的数据,作为诠释项。
进一步,在诠释页面中具有诠释项列表的情况下,对诠释项列表判断真伪的步骤包括,
采集页面中具有页面内链接指引的条目;
判断这些具有页面内链接指引的条目,所链接的页面位置,是否能够指向在页面中的不同区域;
若判断通过的话,则所述的诠释项列表为真,否则为假。
进一步,判断关联强度的步骤是,
判断已采集的网络搜索路径信息的所属领域,以及判断诠释页面中各诠释项的所属领域;
判断前述步骤所获得的两种领域的吻合程度,吻合程度高则关联强度高,吻合程度低则关联强度低。
进一步,在判断信息内容的所属领域时,实现步骤为,
建立各领域所对应的词汇库,在该词汇库中,不同的词汇对应着不同的领域类型;
将采集的数据内容和该词汇库进行比对,从而获得相应的领域信息。
进一步,当两个及两个以上的诠释项,和已采集的网络搜索路径信息属于同一个领域时,针对于网络搜索路径中关联字符与诠释项中关联字符的吻合度进行排序。
进一步,在进行领域判定的情况下,可以先判定网络搜索关键词所属的领域,如果通过网络搜索关键词无法准确判断所属领域的话,那么,增加网络搜索路径信息中的具体页面内容,来协助进行判定。
进一步,在进行吻合度判定时,优先安排相邻网络搜索路径信息进行关联强度比对。
进一步,针对于诠释项设置相应的领域归类标识,根据该领域归类标识和网络搜索路径信息之间进行比对。
进一步,排序形式为,挑选出来领域最吻合的诠释项,排序在前,其它的诠释项按原排序进行输出。
进一步,将非吻合但具有相似性领域的诠释项,在吻合的诠释项排序之后优先排序。
进一步,对同领域诠释项排序的方式为,和已采集的网络搜索路径信息属于同一个领域时,针对于网络搜索路径中关联字符与诠释项中关联字符的吻合度进行排序。
进一步,对同领域诠释项排序的方式为,统计相应的诠释项在网络搜索工具中被查看的次数;
将查看次数高的诠释项排序的前,反之靠后。
进一步,在进行吻合度判定时,优先安排相邻网络搜索路径信息进行关联强度比对。
进一步,在诠释页面中,排序在设定位置之后的诠释项,和处于设定位置之中的诠释项之间,作差异性显示。
进一步,所述的差异性显示,是使其透明度作差异性显示,或颜色作差异性显示,或字符作差异性显示。
本发明还提供一种调整网页排序的搜索结果提供系统,该系统包括:
网络搜索服务器,它包括,
搜索路径采集模块,用以根据客户端的网络路径,采集用户的网络搜索路径信息;
诠释项采集模块,在用户进行诠释搜索的情况下,采集通过关键信息搜索获得的诠释页面,计量该诠释页面中是否包括有针对于同一主题下两个及两个以上诠释项;
诠释项排序模块,用以判断采集获得的网络搜索路径信息与各诠释项之间的关联性,按照关联强度对该页面中的各诠释项进行排序;
客户端,它包括,
网络搜索模块,用以针对于前述的搜索路径采集模块所能够采集数据的网络搜索路径,执行搜索操作;
诠释项输出模块,通过前述的网络搜索服务器获得诠释项排序模块的排序结果,通过所在客户端上的网络浏览器输出包括有排序后的诠释项的页面内容。
附图说明
图1是本发明中一种实施例的流程图。
图2是本发明所述系统的结构框图
具体实施方式
下面针对于本发明,通过具体实施例做详细描述。
在本实施例中,提供了一种通过互联网进行内容诠释的搜索技术,所搜索的网络搜索关键词,为“DC”这两个字母。
参图1所示,本实施例在实施的过程中,包括有如下步骤:
步骤S110,采集用户登录网络搜索工具进行搜索的操作信息;
这儿所描述的网络搜索工具,是能够通过互联网向客户端提供搜索服务的网络工具形式。类似地,像百度、谷歌一类的网络搜索工具,都能够提供类似的服务。但在本发明中,所描述的网络搜索工具,能够支持本发明。
作为举例中的背景信息,用户在搜索“DC”这两个字母前,还搜索了“客户端”、“句柄”这两个信息内容。
步骤S120,所在的网络搜索服务器根据客户端的网络路径,采集用户的网络搜索路径信息;
在该步骤中,为客户端提供搜索服务的网络搜索服务器,需要将数据发送给用户的客户端。在进行数据发送时,需要采集客户端的IP地址和端口号,利用IP地址和端口号生成发送套接字,将相应的搜索信息发送给客户端。
能够将用户所经历的网络路径进行存储。所存储的信息,可以直接与客户端的IP地址和端口号相对应,形成能够区分的路径形式。通过所采集的IP地址和端口号,作为特定客户端的记录信息的索引。
需要指出的是,目前终端设备所使用的IP地址,大多是动态的,因此,采用这种方式所记录的客户端,是临时性的,当用户下次登录的时候,可能就对应着不同的IP地址和端口号了。
另外,这儿所描述的网络搜索路径信息,还可以采集更加稳定的数据形式。比如说,可以向前述的客户端发出MAC地址的采集申请,通过该客户端的响应,获得其MAC地址。MAC地址对应着所在终端的网卡硬件的识别编码,因此,通过该MAC地址能够对用户所登录的客户端进行标记。
另外,还可以采用用户登录的方式,采集用户的网络搜索路径信息。这种情况下,所述的网络搜索工具需要提供相应的登录服务。
在登录过程中,用户可以先输入自己预先注册的用户名称;当然,如果所在的客户端存储有该用户名的话,直接采用已存储的默认用户名就可以了。
然后,用户输入身份识别信息。该身份识别信息,作为典型的实施例,是用户所设定的密码。当用户完成了用户名和密码的输入操作之后,就可以进行登录操作了。具体可将用户所输入的登录信息进行打包,然后将该数据包通过网络传输接口以及传输网络,传送到网络搜索服务器中进行身份识别。在识别通过的情况下,向所在的客户端发出登录成功信息,用户即可完成登录操作了。
在进行登录之后,用户所进行的搜索操作信息,都可以和相应的用户名对应起来,将用户名作为索引信息,来方便地实现网络搜索路径信息的记录操作。
用户采用网络搜索工具进行搜索时,所产生的网络搜索路径信息,典型的情况,首先是网络搜索关键词。
所述的网络搜索关键词,是由用户所输入的用以触发网络搜索的关键信息部分。
在本实施例中,用户利用所述的网络搜索工具,共进行了3次搜索,所输入的网络搜索关键词,分别是“客户端”、“句柄”、“DC”。其中的“客户端”、“句柄”的搜索在前,“DC”的搜索在后。
进一步,所述的网络搜索路径信息,还包括有用户基于网络搜索关键词,进行搜索之后,触发打开的链接页面中的信息内容。
作为举例,用户进行“客户端”、“句柄”等网络搜索关键词的搜索操作之后,就打开了针对于该网络搜索关键词的诠释页面;或者打开了以搜索链接为主的搜索结果页面。
用户进一步打开链接后,就可以引向相应的链接页面了。
在本实施例中,因为用户所需要了解的是计算机方面的诠释信息。因此,所打开的页面,大多和计算机、软件相关,主要是对“客户端”或“句柄”等名词进行解释的网页内容。
前述的网页内容,同样可以被记录。
当然,并不需要通过客户端进行数据采集,直接通过网络搜索服务器进行网络数据的采集操作就可以了。
步骤S130,在用户进行诠释搜索的情况下,采集通过关键信息搜索获得的诠释页面;
通过同一个网络搜索工具,或者用户数据可以共享的多个网络搜索工具,用户进行了针对于网络搜索关键词“客户端”、“句柄”的搜索之后,还启动了针对于新的网络搜索关键词“DC”所进行的诠释搜索。
这儿所述的诠释搜索,并不是针对于互联网搜索网页链接的搜索形式,而是针对于搜索诠释内容的搜索形式。
作为举例,利用百度搜索工具,既可以提供网页链接搜索,同时,也可以提供百度百科这一类的能够提供诠释信息的搜索形式。
诠释搜索的工具类型是多种多样的。比如说,还有著名的维基百科一类的搜索服务,都属于诠释搜索。
诠释搜索所获得的诠释页面,通常不是网页链接形式,而是通过编辑之后,针对于同一页面中的诠释内容。在诠释页面中所存在的链接,也大多是对其诠释内容进一步解释的链接。
当然,凡是能够应用于本发明的其它搜索类型,具体是不限定的。
步骤S140,在该诠释页面中包括有针对于同一主题下两个及两个以上诠释项时,转入下一步骤;
在具体实施时,采集诠释页面后,判断所在的页面中,针对于同一网络搜索关键词所获得的诠释项,是否超过两个。经判断之后,如果只有一个的话,那么,直接将诠释内容输出就可以了,不涉及排序;只有诠释项包括有两个或者两个以上时,才有进行排序的需要。
采集诠释项的方式,作为举例而非限定,可以这样进行:
针对于诠释页面,设定诠释项的内容格式;
然后,遍历用户所浏览网页中的数据内容,判断获得的内容形式中,是否包括有诠释项的内容格式;
采集符合诠释项内容格式的数据,作为诠释项。
其中,在采集过程中,包括对同一网页中诠释项数量的累加,以获得全部的诠释项,并计算获得诠释项的数量。
进一步,有一些诠释页面还具有诠释项列表。所述的诠释项列表,指的是通常设置在诠释页面的上部,包括有各诠释具体内容指引的页面内链接。在进行诠释页面的排序时,可以直接针对于诠释项列表进行排序。
对于诠释项列表,还可以对其判定,以校验是否为真的诠释项列表。
于是,就可以根据诠释项列表具有页面内链接指引的这一特性,判定所对应的页面内是否包括有诠释项列表,具体判定步骤如下:
采集页面中具有页面内链接指引的条目;
判断这些具有页面内链接指引的条目,所链接的页面位置,是否能够指向页面中的不同区域;
如果判断通过的话,则所述的诠释项列表为真,否则为假。
在本实施例中,采用的网络搜索关键词为“DC”,针对于该关键词,采用类似于百度百科的网络搜索工具,作为举例,一共获得31个诠释项。这些诠释项所对应的条目,在页面的上方形成诠释项列表,诠释项列表中的各条目,指引向所在页面中的不同位置,具体对应着同一主题下的各个诠释项的内容区域。
步骤S150,判断采集获得的网络搜索路径信息与各诠释项之间的关联性;
前面所获得的网络搜索路径信息,作为举例而非限定,包括有来自于同一客户端的网络搜索关键词“客户端”、“句柄”,以及针对于这两个网络搜索关键词所获得的页面内容。于是,就可以基于用户的搜索记录,来判定用户已作出的搜索记录和新开启诠释页面中各诠释项之间的关联性。
在本发明中,这种关联性的具体判断结论,称为关联强度。关联强度的判定方式是不限定的,下面举例描述。
首先,我们提供一种通过所属领域判定关联强度的方式。该方式作为举例,包括有如下步骤:
首先,判断已采集的网络搜索路径信息的所属领域,以及判断诠释页面中各诠释项的所属领域;
然后,判断前述步骤所获得的两种领域的吻合程度,吻合程度高则关联强度高,吻合程度低则关联强度低。
比如,完全吻合,可以给关联强度赋值为5,完全不吻合赋值为1,其它的吻合度介于该赋值之间。
在判断信息内容的所属领域时,可通过预先建立领域判定组件来协助进行。
所述的领域判定组件,可以通过如下的方式来实现:
首先建立各领域所对应的词汇库,在该词汇库中,不同的词汇对应着不同的领域类型;
然后,将采集的数据内容和该词汇库进行比对,从而获得相应的领域信息。
作为举例,前面所输入的网络搜索关键词,包括“客户端”、“句柄”两者信息内容,均属于计算机领域。
在进行网络信息的领域判定时,可以先判定网络搜索关键词所属的领域,如果通过网络搜索关键词无法准确判断所属领域的话,那么,就可以增加网络搜索路径信息中的具体页面内容,来协助进行判定。
通过领域的吻合性程度,针对于同一个网络搜索关键词在诠释页面中的两个及两个以上的诠释项,来进行排序。
常用的排序形式,是这样来实施的:
挑选出来领域最吻合的诠释项,排序在前;
然后其它的诠释项,还可以按原排序进行输出。
当然,具体的排序方式并不限定。作为举例,还可以将具有相似性的领域做优先排序。比如说,经过领域比对之后,新搜索到的诠释项,完全吻合的领域为计算机领域,而电子领域与其具有相似性。于是,就可以首先将最为吻合的计算机领域所对应的诠释项排序在最前,然后,将领域具有相似性的电子领域的诠释项随后进行优先排序。
需要指出的是,经比对之后,领域完全符合的诠释项包括有两个及两个以上的情况时,既可以直接将符合比对条件的诠释项全部输出,不另加处理;还可以在输出这些诠释项的基础上,再做排序。
对符合条件的同领域诠释项包括有两个及两个以上情况下,所进行的先后排序的方式,具体是不限定的,下面举例描述:
方式1,针对于网络搜索路径中关联字符与诠释项中关联字符的吻合度进行排序。
这儿所述的关联字符,指的是已形成网络搜索路径的信息内容,直接和诠释项中的具体内容进行比对,而不仅仅通过网络搜索关键词的领域进行比对。
然后,比对出现相同词汇的频率,出现频率高的诠释项排序在前,出现频率低的诠释项排序在后。
方式2,根据所搜索词汇的网络查询频率,协助进行排序。这种情况下,就需要统计相应的诠释项在所关联的网络搜索范围内被查看的次数,将查看频率高的诠释项排序在前,反之靠后。
另外,在进行吻合度判定时,适合优先安排相邻网络搜索路径信息进行关联强度比对。比如,用户首先搜索了计算机领域的词汇,然后又搜索了农业方面的词汇。于是,当再次进行搜索,对诠释内容进行排序时,农业方面的搜索内容就应当被优先进行排序。完成参照农业方面所属领域的排序之后,再进行前面计算机领域内容的排序。
需要指出的是,如果网络搜索工具服务提供商,能够对诠释项的所属领域预先进行分类的话,那么,就可以直接采集诠释项的领域分类信息,来和网络搜索路径信息所对应的领域进行比对了,这样能够提高比对的准确度。
步骤S160,按照关联强度对该页面中的各诠释项进行排序后输出。
诠释项的排序,如果包括有诠释项列表的话,则可以包括有诠释项列表的排序。而且,仅仅对诠释项列表进行排序,也是良好的实施例。
进一步,在进行了诠释项列表的排序之后,还可以对具体的诠释项内容部分进行排序。
如果没有诠释项列表,而直接输出的是诠释项具体内容的话,则仅仅包括对诠释内容的排序。
当完成了各诠释项的排序之后,就可以将排序后的诠释页面,通过网络搜索服务器进行数据打包后,经由配套的通信网络传输至客户端。客户端通过网络接口,采用异步数据接收的方式接收到包括有排序后诠释页面的数据包,经过解密和解析之后,载入到对应的互联网浏览工具中,输出给用户。
需要指出的是,经过排序之后的诠释项,还可以作差异性显示。比如,优选出的排序靠前的诠释项,可以将其字符变大,或者颜色作差异性显示,比如周围字符内容为黑色,而选择出来的诠释项的字符为蓝色;或者,做符号标记,比如加上五角星来进行突出显示;或者,也可以做透明度方面的调整,比如没有被选中的是诠释项,可以改变其透明度,使其看起来具有区别;或者使其颜色直接变浓或变淡,或改变色彩,等等,具体形式是不限定的。
结合图2所示,本发明还提供了一种调整网页排序的搜索结果提供系统100,该系统包括:
网络搜索服务器200,它包括,
搜索路径采集模块210,用以根据客户端的网络路径,采集用户的网络搜索路径信息;
诠释项采集模块220,在用户进行诠释搜索的情况下,采集通过关键信息搜索获得的诠释页面,计量该诠释页面中是否包括有针对于同一主题下两个及两个以上诠释项;
诠释项排序模块230,用以判断采集获得的网络搜索路径信息与各诠释项之间的关联性,按照关联强度对该页面中的各诠释项进行排序
客户端300,它包括,
网络搜索模块310,用以针对于前述的搜索路径采集模块210所能够采集数据的网络搜索路径,执行搜索操作;
诠释项输出模块320,通过前述的网络搜索服务器200获得诠释项排序模块的排序结果,通过所在客户端上的网络浏览器输出包括有排序后的诠释项的页面内容。
以及通信网400,提供前述网络搜索服务器200和客户端300之间的通信连接操作,作为举例,可以采用互联网来实现。
在具体使用时,所述的客户端,比如个人电脑,是用户进行网络搜索的物理结构。通过网络搜索模块310,来针对于所述的搜索路径采集模块210所能够采集数据的网络搜索路径,执行网络搜索的相关操作。比如,假如“百度百科”所对应的搜索路径具有该功能的话,那么,只有在该搜索路径下的搜索操作,在本发明中才是有效的。而没有预先设定该功能的搜索路径,进行网络搜索也无法执行本发明。
然后,通过网络搜索服务器200中的搜索路径采集模块210,对用户所进行的网络搜索数据进行采集,该采集结果可以为诠释项采集模块220所服务。
所述的诠释项采集模块220,需要能够有效地采集诠释页面的相关信息,以及采集诠释项的内容形式。在本发明中,需要所在的搜索页面具有诠释页面,这样才能够应用本发明;而且,需要在同一主题下包括两个及两个以上诠释项时,才能够进一步应用本发明进行排序操作。
所述的诠释项排序模块230,就是在满足前述要求的情况下,通过搜索路径采集模块210,来对诠释项采集模块220所采集获得的诠释项进行排序,形成排序结果;排序的方式,前面已描述。
进一步,针对于前述的网络搜索服务器200,设置有相应的网络传输接口,将诠释项排序模块所获得的排序结果,传输到客户端300的诠释项输出模块进行输出,形成包括排序后的诠释项的网络页面,通过客户端输出给用户。
以上是对本发明的描述而非限定,基于本发明的思想所实现的其它实施例,亦均在本发明的保护范围之中。

Claims (21)

1.一种调整网页排序的搜索结果提供方法,其特征在于该方法包括有如下步骤:
步骤1,网络搜索服务器根据客户端的网络路径,采集用户的网络搜索路径信息;
步骤2,在用户进行诠释搜索的情况下,采集通过关键信息搜索获得的诠释页面,在该诠释页面中包括有针对于同一主题下两个及两个以上诠释项时,转入下一步骤;
步骤3,判断采集获得的网络搜索路径信息与各诠释项之间的关联性,按照关联强度对该页面中的各诠释项进行排序后输出;
所述诠释搜索,是搜索诠释内容的搜索形式;
其中,所述的网络搜索路径信息,包括有网络搜索关键词,或用户所点击的网络搜索超链接页面中的内容信息。
2.根据权利要求1所述的一种调整网页排序的搜索结果提供方法,其特征在于:所述的网络路径,是通过记录用户的IP地址和端口号,来进行标识的。
3.根据权利要求1所述的一种调整网页排序的搜索结果提供方法,其特征在于:所述的网络路径,是通过记录用户的MAC地址来进行标识的。
4.根据权利要求1所述的一种调整网页排序的搜索结果提供方法,其特征在于:通过采集用户的登录方式,来获得用户的网络搜索路径信息。
5.根据权利要求1所述的一种调整网页排序的搜索结果提供方法,其特征在于:所述的诠释页面中的信息内容,是同一个页面中针对于同一主题的诠释内容项。
6.根据权利要求1所述的一种调整网页排序的搜索结果提供方法,其特征在于:
采集获得的诠释页面;
判断所在的页面中,针对于同一网络搜索关键词所获得的诠释项,是否超过两个;
经判断之后,如果只有一个的话,直接将该信息显示,如果包括有两个或者两个以上的话,则进行排序。
7.根据权利要求1所述的一种调整网页排序的搜索结果提供方法,其特征在于:采集诠释项的步骤为,
针对于诠释页面,设定诠释项的内容格式;
遍历用户所浏览网页中的数据内容,判断获得的内容形式中,是否包括有诠释项的内容格式;
在存在诠释项的内容格式的情况下,采集符合诠释项内容格式的数据,作为诠释项。
8.根据权利要求1所述的一种调整网页排序的搜索结果提供方法,其特征在于:在诠释页面中具有诠释项列表的情况下,对诠释项列表判断真伪的步骤包括,
采集页面中具有页面内链接指引的条目;
判断这些具有页面内链接指引的条目,所链接的页面位置,是否能够指向在页面中的不同区域;
若判断通过的话,则所述的诠释项列表为真,否则为假。
9.根据权利要求1所述的一种调整网页排序的搜索结果提供方法,其特征在于:判断关联强度的步骤是,
判断已采集的网络搜索路径信息的所属领域,以及判断诠释页面中各诠释项的所属领域;
判断前述步骤所获得的两种领域的吻合程度,吻合程度高则关联强度高,吻合程度低则关联强度低。
10.根据权利要求9所述的一种调整网页排序的搜索结果提供方法,其特征在于:在判断信息内容的所属领域时,实现步骤为,
建立各领域所对应的词汇库,在该词汇库中,不同的词汇对应着不同的领域类型;
将采集的数据内容和该词汇库进行比对,从而获得相应的领域信息。
11.根据权利要求9所述的一种调整网页排序的搜索结果提供方法,其特征在于:当两个及两个以上的诠释项,和已采集的网络搜索路径信息属于同一个领域时,针对于网络搜索路径中关联字符与诠释项中关联字符的吻合度进行排序。
12.根据权利要求9所述的一种调整网页排序的搜索结果提供方法,其特征在于:在进行领域判定的情况下,先判定网络搜索关键词所属的领域,如果通过网络搜索关键词无法准确判断所属领域的话,那么,增加网络搜索路径信息中的具体页面内容,来协助进行判定。
13.根据权利要求9所述的一种调整网页排序的搜索结果提供方法,其特征在于:在进行吻合度判定时,优先安排相邻网络搜索路径信息进行关联强度比对。
14.根据权利要求9所述的一种调整网页排序的搜索结果提供方法,其特征在于:针对于诠释项设置相应的领域归类标识,根据该领域归类标识和网络搜索路径信息之间进行比对。
15.根据权利要求1或9所述的一种调整网页排序的搜索结果提供方法,其特征在于:排序形式为,挑选出来领域最吻合的诠释项,排序在前,其它的诠释项按原排序进行输出。
16.根据权利要求9所述的一种调整网页排序的搜索结果提供方法,其特征在于:将非吻合但具有相似性领域的诠释项,在吻合的诠释项排序之后优先排序。
17.根据权利要求9所述的一种调整网页排序的搜索结果提供方法,其特征在于:对同领域诠释项排序的方式为,和已采集的网络搜索路径信息属于同一个领域时,针对于网络搜索路径中关联字符与诠释项中关联字符的吻合度进行排序。
18.根据权利要求9所述的一种调整网页排序的搜索结果提供方法,其特征在于:对同领域诠释项排序的方式为,统计相应的诠释项在网络搜索工具中被查看的次数;
将查看次数高的诠释项排序的前,反之靠后。
19.根据权利要求1所述的一种调整网页排序的搜索结果提供方法,其特征在于:在诠释页面中,排序在设定位置之后的诠释项,和处于设定位置之中的诠释项之间,作差异性显示。
20.根据权利要求19所述的一种调整网页排序的搜索结果提供方法,其特征在于:所述的差异性显示,是使其透明度作差异性显示,或颜色作差异性显示,或字符作差异性显示。
21.一种调整网页排序的搜索结果提供系统,其特征在于该系统包括:
网络搜索服务器,它包括,
搜索路径采集模块,用以根据客户端的网络路径,采集用户的网络搜索路径信息;
诠释项采集模块,在用户进行诠释搜索的情况下,采集通过关键信息搜索获得的诠释页面,计量该诠释页面中是否包括有针对于同一主题下两个及两个以上诠释项;
诠释项排序模块,用以判断采集获得的网络搜索路径信息与各诠释项之间的关联性,按照关联强度对该页面中的各诠释项进行排序;
客户端,它包括,
网络搜索模块,用以针对于前述的搜索路径采集模块所能够采集数据的网络搜索路径,执行搜索操作;
诠释项输出模块,通过前述的网络搜索服务器获得诠释项排序模块的排序结果,通过所在客户端上的网络浏览器输出包括有排序后的诠释项的页面内容;
所述诠释搜索,是搜索诠释内容的搜索形式;
其中,
所述的网络搜索路径信息,包括有网络搜索关键词,或用户所点击的网络搜索超链接页面中的内容信息。
CN201110251430.7A 2011-08-29 2011-08-29 调整网页排序的搜索结果提供方法及系统 Active CN102298629B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110251430.7A CN102298629B (zh) 2011-08-29 2011-08-29 调整网页排序的搜索结果提供方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110251430.7A CN102298629B (zh) 2011-08-29 2011-08-29 调整网页排序的搜索结果提供方法及系统

Publications (2)

Publication Number Publication Date
CN102298629A CN102298629A (zh) 2011-12-28
CN102298629B true CN102298629B (zh) 2017-06-20

Family

ID=45359043

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110251430.7A Active CN102298629B (zh) 2011-08-29 2011-08-29 调整网页排序的搜索结果提供方法及系统

Country Status (1)

Country Link
CN (1) CN102298629B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107301189A (zh) * 2016-04-15 2017-10-27 阿里巴巴集团控股有限公司 一种数据展示方法及装置
CN107066493A (zh) * 2016-12-29 2017-08-18 广州联客信息科技有限公司 一种利用ip地址的搜索引擎的结果排序优化方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101477554A (zh) * 2009-01-16 2009-07-08 西安电子科技大学 基于用户兴趣的个性化元搜索引擎及搜索结果处理方法
CN101763395A (zh) * 2009-12-31 2010-06-30 浙江大学 采用人工智能技术自动生成网页的方法
CN101853308A (zh) * 2010-06-11 2010-10-06 中兴通讯股份有限公司 一种个性化元搜索的方法及其应用终端

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101477554A (zh) * 2009-01-16 2009-07-08 西安电子科技大学 基于用户兴趣的个性化元搜索引擎及搜索结果处理方法
CN101763395A (zh) * 2009-12-31 2010-06-30 浙江大学 采用人工智能技术自动生成网页的方法
CN101853308A (zh) * 2010-06-11 2010-10-06 中兴通讯股份有限公司 一种个性化元搜索的方法及其应用终端

Also Published As

Publication number Publication date
CN102298629A (zh) 2011-12-28

Similar Documents

Publication Publication Date Title
US7853589B2 (en) Web spam page classification using query-dependent data
US7594011B2 (en) Network traffic monitoring for search popularity analysis
US7831581B1 (en) Enhanced search
CN102955798B (zh) 一种基于搜索引擎的搜索方法及搜索服务器
US6714934B1 (en) Method and system for creating vertical search engines
US7941428B2 (en) Method for enhancing search results
CN101908071B (zh) 一种提高搜索引擎搜索效率的方法及其系统
US20080040389A1 (en) Landing page identification, tagging and host matching for a mobile application
US20030131000A1 (en) Group-based search engine system
CN106933959A (zh) 浏览器侧进行网络搜索的方法与浏览器
US20030187832A1 (en) Method for locating patent-relevant web pages and search agent for use therein
CN101317177A (zh) 确定内容提供商优先级的系统和方法
CN109768992A (zh) 网页恶意扫描处理方法及装置、终端设备、可读存储介质
JP2004510257A (ja) 使用者の検索を容易にするインターネット検索システム及びその方法
JP2010506255A (ja) ブックマークおよびランク付け
CN103116635A (zh) 面向领域的暗网资源采集方法和系统
CN103412913B (zh) 一种关联搜索方法和系统
CN102298629B (zh) 调整网页排序的搜索结果提供方法及系统
Guha Related Fact Checks: a tool for combating fake news
KR101556714B1 (ko) 검색결과 제공 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
Priyatam et al. Domain specific search in indian languages
Ham et al. Big Data Preprocessing Mechanism for Analytics of Mobile Web Log.
CN102957721B (zh) 一种用于基于标识信息对用户进行分类的设备和方法
CN103902687B (zh) 一种搜索结果的生成方法及装置
US9461897B1 (en) Monitoring and analysis of social network traffic

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Wang Jianhong

Inventor before: The inventor has waived the right to be mentioned

COR Change of bibliographic data
CB03 Change of inventor or designer information

Inventor after: Ma Yuchen

Inventor before: Wang Jianhong

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant