CN102314456A - 网页划词搜索方法及系统 - Google Patents

网页划词搜索方法及系统 Download PDF

Info

Publication number
CN102314456A
CN102314456A CN2010102223805A CN201010222380A CN102314456A CN 102314456 A CN102314456 A CN 102314456A CN 2010102223805 A CN2010102223805 A CN 2010102223805A CN 201010222380 A CN201010222380 A CN 201010222380A CN 102314456 A CN102314456 A CN 102314456A
Authority
CN
China
Prior art keywords
entry
definition information
page
webpage
coupling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010102223805A
Other languages
English (en)
Inventor
张东进
支静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN2010102223805A priority Critical patent/CN102314456A/zh
Publication of CN102314456A publication Critical patent/CN102314456A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种网页划词搜索方法,包括:百科数据搜索引擎接收用户终端提交的在网页内划选的词条;所述百科数据搜索引擎根据所述词条查询所述百科数据库,将查询到的与所述词条匹配的定义信息形成词条页面;所述百科数据搜索引擎将所述词条页面发送到所述用户终端,以使所述用户终端进行展示。本发明还涉及一种网页划词搜索系统。本发明根据百科数据库对网页中的被划选词条进行定向搜索,将该词条的定义信息作为结果反馈给用户,从而既节省了用户的搜索步骤,同时也利用百科数据库的信息中较高的有效性和安全性来确保搜索结果的有用和有效。

Description

网页划词搜索方法及系统
技术领域
本发明涉及网络数据处理技术,尤其涉及一种网络页面中划词搜索的方法及系统。
背景技术
随着互联网的逐渐普及和应用,人们逐渐改变了传统的获取信息的方式,形成了通过网络搜索来获取需要的信息的新方式,使得信息的采集传播的速度和规模都达到了空前的水平。然而其带来的副作用是给人们的辨识带来了困难,人们很难在信息海洋中迅速准确地获取自己所需的精准信息。为了获取有用的信息,已有一些公司和组织开发出搜索引擎、专业数据库、客户端软件等工具试图帮助人们尽量容易的获取所需要的信息,但不同程度地受到产品技术基础束缚,无法克服自身的局限。主要局限在于:
1、搜索成本较高
人们在使用搜索引擎时,需要先手动输入搜索引擎的链接地址,在进入含有搜索功能的页面后,还需在页面的搜索框内手动输入需要搜索的信息关键词,提交关键词来进行搜索,这种搜索方式不光步骤繁琐,还对使用者是否知道对应的搜索引擎页面、是否掌握至少一种输入法,提出了底线要求。
2、搜索结果驳杂
由于搜索引擎产品,基于网络页面文字、图片、视频、音频的内容标签计算相关度,无法从寥寥的关键词,精准解析用户的实际需求,因此往往将关联到的结果一并展示给用户自行判断。这些相关信息驳杂繁复,用户常常需要采用多个搜索引擎,通过翻阅多个搜索结果页面,才能找到需求信息。这又对用户所具备的时间、耐心是个很大的挑战。
3、信息有效性与网络安全无法保障
搜索结果页固然含有关键词标签,但内容是否与用户需求匹配、是否页面能正常打开(超链有效),甚至是否含有木马和骚扰性广告,对于用户而言,在实际点击结果页链接鉴别之前,都是很难预知的。
目前已出现一些新的网络搜索方式,例如划词搜索,即用户在桌面的应用程序的文本区内通过鼠标进行划词,然后系统将被划选到的文本发送到网络侧进行搜索,从而节省了常规搜索程序的步骤,而且也方便了不熟悉输入法或者键盘使用的人群。但对于上述第2、3个问题,尚无解决方案。
专业数据库和客户端软件,虽然能够保障结果的关联性和安全性,但其信息的更新速度,数据容量受产品迭代周期限制。即使把传统纸媒的工具词典数据全部变成电子版可供搜索查阅,也无法跟上信息自身实际变化速度和广大用户需求扩张速度,准入门槛也相对较高(知道如何注册使用专业数据库,或知道如何安装、配置和升级专业客户端软件),并不能保障其信息真正能让全体网民共享。
同时,此类搜索产品对于信息的梳理沉淀,往往依赖数据库、软件本身研发方的投入。单个用户的单个已有搜索行为,及其最终获取结果,也无法转化为另一个用户的搜索经验,被分享和继承。
发明内容
本发明的一个目的是提出一种网页划词搜索方法及系统,既简化人们的搜索步骤,又能获得有用、有效的信息。
为实现上述目的,本发明提供了一种网页划词搜索方法,包括:
百科数据搜索引擎接收用户终端提交的在网页内划选的词条;
所述百科数据搜索引擎根据所述词条查询所述百科数据库,将查询到的与所述词条匹配的定义信息形成词条页面;
所述百科数据搜索引擎将所述词条页面发送到所述用户终端,以使所述用户终端进行展示。
进一步的,在所述百科数据搜索引擎根据所述词条查询所述百科数据库时,如果查询不到与所述词条匹配的定义信息,则向词典数据库进行查询,将查询到的与词条匹配的定义信息形成词条页面。
进一步的,当查询结果中包括多个与词条匹配的定义信息时,按照各个定义信息的权重进行排序,优先在形成的词条页面中展示权重较高的定义信息。
进一步的,所述词条页面还包括链接到与所述词条匹配的定义信息的详细内容页面的超级链接,当接收到用户终端点击该超级链接而发出的浏览请求,将所述详细内容页面发送到所述用户终端。
进一步的,接收到与所述词条匹配的定义信息的详细内容页面的浏览请求时,记录与所述词条匹配的定义信息的有效浏览次数,并根据有效浏览累计次数调整与所述词条匹配的定义信息的权重。
进一步的,接收到与所述词条匹配的定义信息的详细内容页面的浏览请求时,记录与所述词条匹配的定义信息的有效浏览次数,当所述词条的单位有效浏览次数超过预设阈值,则在所述网页中添加所述词条的内部链接。
进一步的,在用户终端提交在网页内划选的词条时,生成包括所述词条页面的弹出窗口,在所述弹出窗口中以浮动层窗口方式进行展示所述用户终端接收到的所述词条页面。
进一步的,在生成所述弹出窗口后,当捕捉到所述输入设备在所述弹出窗口或被划选的文本之外的区域的点击消息,则关闭所述包括所述词条页面的弹出窗口。
进一步的,在所述百科数据搜索引擎根据所述词条查询所述百科数据库时,还对与所述词条匹配的定义信息的版本质量进行查询,在形成的词条页面中还包括与所述词条匹配的定义信息的版本质量标识。
进一步的,当所述百科数据搜索引擎在所述百科数据库和词典数据库均未查询到与所述词条匹配的定义信息时,则在形成的词条页面中包括提示无搜索结果的信息,或形成的词条页面中包括所述词条相关的词条。
为实现上述目的,本发明提供了一种网页划词搜索系统,包括:
百科数据库,用于保存网络用户可编辑的词条的定义信息;
百科数据搜索引擎,用于接收用户终端提交的在网页内划选的词条,并根据所述词条查询所述百科数据库,并将查询到的与所述词条匹配的定义信息形成词条页面,并将所述词条页面发送到所述用户终端,以使所述用户终端进行展示。
进一步的,所述百科数据搜索引擎具体包括:
词条输入接收模块,用于接收用户终端提交的在网页内划选的词条;
词条查询模块,用于根据所述词条查询所述百科数据库;
词条页面形成模块,用于根据查询结果中的与所述词条匹配的定义信息形成词条页面;
词条页面发送模块,用于将所述词条页面发送到所述用户终端,以使所述用户终端进行展示。
进一步的,还包括:
词典数据库,用于保存网络用户不可编辑的词条的定义信息;
词条查询模块还用于在查询所述百科数据库时,如果查询不到与所述词条匹配的定义信息,则向所述词典数据库进行查询。
进一步的,所述词条页面形成模块还用于在查询结果中包括多个词条的定义信息时,按照各个定义信息的权重进行排序,优先在形成的词条页面中展示权重较高的定义信息。
进一步的,所述词条页面还包括链接到与所述词条匹配的定义信息的详细内容页面的超级链接,所述百科数据搜索引擎还包括:
详细页面发送模块,用于在接收到用户终端点击该超级链接而发出的浏览请求,将所述详细内容页面发送到所述用户终端。
进一步的,所述百科数据搜索引擎还包括:
权重调整模块,用于在接收到与所述词条匹配的定义信息的详细内容页面的浏览请求时,记录与所述词条匹配的定义信息的有效浏览次数,并根据有效浏览累计次数调整与所述词条匹配的定义信息的权重。
进一步的,所述百科数据搜索引擎还包括:
内链添加模块,用于接收到与所述词条匹配的定义信息的详细内容页面的浏览请求时,记录与所述词条匹配的定义信息的有效浏览次数,当所述词条的单位有效浏览次数超过预设阈值,则在所述网页中添加所述词条的内部链接。
进一步的,所述百科数据搜索引擎还包括:
版本质量查询模块,用于对与所述词条匹配的定义信息的版本质量进行查询,在所述词条页面形成模块形成的词条页面中增加与所述词条匹配的定义信息的版本质量标识。
基于上述技术方案,本发明根据百科数据库对网页中的被划选词条进行定向搜索,将该词条的定义信息作为结果反馈给用户,从而既节省了用户的搜索步骤,同时也利用百科数据库的信息中较高的有效性和安全性来确保搜索结果的有用和有效。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明网页划词搜索方法的第一实施例的流程示意图。
图2为本发明网页划词搜索方法的第二实施例的流程示意图。
图3为本发明网页划词搜索方法的第三实施例的流程示意图。
图4为本发明网页划词搜索方法的第四实施例的流程示意图。
图5为本发明网页划词搜索系统的第一实施例的结构示意图。
图6为本发明网页划词搜索系统的第二实施例的结构示意图。
图7为本发明网页划词搜索系统的第三实施例的结构示意图。
具体实施方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
如图1所示,为本发明网页划词搜索方法的第一实施例的流程示意图。在本实施例中,网页划词搜索流程包括:
步骤101、百科数据搜索引擎接收用户终端提交的在网页内划选的词条;
步骤102、所述百科数据搜索引擎根据所述词条查询所述百科数据库;
步骤103、将查询到的与所述词条匹配的定义信息形成词条页面;
步骤104、所述百科数据搜索引擎将所述词条页面发送到所述用户终端,以使所述用户终端进行展示。
在步骤101中,用户终端可以利用软件、浏览器插件或者cookie技术将用户通过输入设备(例如鼠标、触摸板等)在网页内划选的词条提高到网络侧的百科数据搜索引擎,利用cookie技术还可以针对具体用户进行用户行为统计,实现个性化划词搜索。
百科数据搜索引擎在接收到被划选的词条后,将定向的向百科数据库发出查询,而不是如传统方式下的网页搜索,由于百科数据库中保存的是可由网络用户参与编辑的知识型信息,具体来说,百科数据库中保存了一些词条和词条的定义信息,这些词条和词条的定义信息的创建和编辑都可由网络用户进行编辑。这些词条和词条的定义信息经过多次编辑后,具有一定的实用性,且信息的有效性和时效性都能够得到保证当人们在网络上浏览信息时,划词的目的经常是希望了解被划选词条的含义,而百科数据库中保存的信息比较符合这种特点,从而使用户在划词搜索时能够更快的获得有用有效的信息。
在用户终端提交在网页内划选的词条时,生成弹出窗口,在弹出窗口中以浮动层窗口方式进行展示用户终端接收到的词条页面。在生成弹出窗口后,当捕捉到输入设备(例如鼠标、触摸板等)在弹出窗口或被划选的文本之外的区域的点击消息,则关闭包括所述词条页面的弹出窗口。
在百科数据库中还可以保存词条的定义信息的版本质量,版本质量通常是事先审核确定的,这样在百科数据搜索引擎根据词条查询百科数据库时,还可以对与词条匹配的定义信息的版本质量进行查询,从而可以在形成的词条页面中还包括与词条匹配的定义信息的版本质量标识。在弹出窗口中也能够展示出与词条匹配的定义信息的版本质量标识来提示浏览用户其所看到的词条的定义信息的质量好坏,给浏览用户更全面的信息。
如图2所示,为本发明网页划词搜索方法的第二实施例的流程示意图。与上一实施例相比,本实施例在步骤102之后还包括以下步骤:
步骤102a、判断是否在百科数据库中查询到与被划选词条匹配的定义信息,是则执行步骤103,否则执行步骤102b;
步骤102b、向词典数据库进行查询,然后执行步骤103来将查询到的与词条匹配的定义信息形成词条页面。
词典数据库中保存了一些网络用户不可编辑的知识型信息,这些信息的来源通常是一些传统的字词典(也包括百科全书等),由于这些字词典的编撰者和审查者具有较高的专业性和权威性,因此确保了这些传统载体中的信息的有效性和权威性。当百科数据库中无法查询到词条相匹配的定义信息时,可以利用词典数据库来进行词条的定义信息的查询,进而来弥补百科数据库覆盖不全面和专业性差的缺陷。
当百科数据搜索引擎在百科数据库和词典数据库均未查询到与被划选词条匹配的定义信息时,则在形成的词条页面中包括提示无搜索结果的信息,或形成的词条页面中包括所述词条相关的词条。
以被划选词条“见鬼”为例,假设百科数据库中存有该词条的定义信息“见鬼通常用来比喻很古怪......”,则根据该定义信息形成词条页面,但如果百科数据库中并没有与该词条匹配的定义信息,此时可以继续查询词典数据库,假设词典数据库仍然没有该词条的定义信息,则可以直接在向用户终端返回的词条页面中包括提示无搜索结果的信息。更优的方式是,在向用户终端返回的词条页面包括与该词条相关的词条,例如白日见鬼、梦见鬼等其他词条,同时也可以提示网络用户参与“见鬼”词条的创建。
当百科数据搜索引擎查询到的结果中包括多个与词条匹配的定义信息时,按照各个定义信息的权重进行排序,优先在形成的词条页面中展示权重较高的定义信息。这里的多个定义信息可以是某个词条的多个词义,也可以是多种表现形式的定义信息,例如文字、图片、视频等。由于定义信息可能有较大篇幅或者表现形式不适合通过弹出窗口实现,则可以在词条页面还包括链接到与词条匹配的定义信息的详细内容页面的超级链接,当接收到用户终端点击该超级链接而发出的浏览请求,将所述详细内容页面发送到用户终端。
通过对用户点击超级链接,以及在详细内容页面的浏览行为的采集可以为动态调整搜索结果带来帮助。如图3所示,为本发明网页划词搜索方法的第三实施例的流程示意图。与第一实施例相比,本实施例中在步骤104之后,还包括以下步骤:
步骤105、接收到与所述词条匹配的定义信息的详细内容页面的浏览请求,将详细内容页面发送到所述用户终端;
步骤106、记录与所述词条匹配的定义信息的有效浏览次数,并根据有效浏览累计次数调整与所述词条匹配的定义信息的权重。
这里的有效浏览次数主要是考虑网络用户在该详细内容页面的停留时间是否达到预设阈值,是否在该详细内容页面有复制操作等因素,被确认为有效浏览的详细内容页面则被计数,并且统计该详细内容页面的有效浏览累计次数(包括多个网络用户的有效浏览次数),对于某个词条来说,如果其多个定义信息中的某个定义信息的详细内容页面的有效浏览累计次数较高,则可以认为该详细内容页面更符合网络用户的阅读需求,因此可以根据该有效浏览累计次数调整与所述词条匹配的定义信息的权重,通过调整权重来调整在形成的词条页面中展示哪些定义信息,将多个网络用户的划词查询浏览的行为延展到划词查询得到的词条页面的显示内容,从而使后续进行划词查询的网络用户能够获得更直接有效的词条的定义信息。
如图4所示,为本发明网页划词搜索方法的第四实施例的流程示意图。与第一实施例相比,本实施例中在步骤104之后,还包括以下步骤:
步骤105a、接收到与所述词条匹配的定义信息的详细内容页面的浏览请求时,将详细内容页面发送到所述用户终端;
步骤106a、记录与所述词条匹配的定义信息的有效浏览次数,当所述词条的单位有效浏览次数超过预设阈值,则在所述网页中添加所述词条的内部链接。
对于某些词条的定义信息的详细内容页面被多人进行有效浏览,其单位有效浏览次数超过预设阈值,换句话说,当判断在所有点击该详细内容页面的超级链接的次数中完成有效浏览的次数达到预设阈值时,则在该网页内添加该词条的内部链接,该内部链接将直接链接到该词条的详细内容页面。
通过内链添加,可以使多个网络用户的划词查询和浏览行为转化成经验行为,即多人的经验是该添加内链的词条可能与该网页有较高的相关度,因此有较高的查询价值,从而直接添加内链,省去其他网络用户划词查询的方式,而转化成直接点击的方式。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
如图5所示,为本发明网页划词搜索系统的第一实施例的结构示意图。在本实施例中,网页划词搜索系统包括:百科数据库1和百科数据搜索引擎2。其中百科数据库1用于保存网络用户可编辑的词条的定义信息。百科数据搜索引擎2用于接收用户终端提交的在网页内划选的词条,并根据所述词条查询所述百科数据库1,并将查询到的与所述词条匹配的定义信息形成词条页面,并将所述词条页面发送到所述用户终端,以使所述用户终端进行展示。
百科数据搜索引擎2可以具体包括:词条输入接收模块21、词条查询模块22、词条页面形成模块23和词条页面发送模块24。
词条输入接收模块21用于接收用户终端提交的在网页内划选的词条。词条查询模块22用于根据所述词条查询所述百科数据库1。词条页面形成模块23用于根据查询结果中的与所述词条匹配的定义信息形成词条页面。词条页面发送模块24用于将所述词条页面发送到所述用户终端,以使所述用户终端进行展示。
百科数据搜索引擎2在接收到被划选的词条后,将定向的向百科数据库1发出查询,而不是如传统方式下的网页搜索,由于百科数据库1中保存的是可由网络用户参与编辑的知识型信息,具体来说,百科数据库1中保存了一些词条和词条的定义信息,这些词条和词条的定义信息的创建和编辑都可由网络用户进行编辑。这些词条和词条的定义信息经过多次编辑后,具有一定的实用性,且信息的有效性和时效性都能够得到保证当人们在网络上浏览信息时,划词的目的经常是希望了解被划选词条的含义,而百科数据库1中保存的信息比较符合这种特点,从而使用户在划词搜索时能够更快的获得有用有效的信息。
在百科数据库1中还可以保存词条的定义信息的版本质量,版本质量通常是事先审核确定的,这样在网页划词搜索系统的另一实施例中,可以在百科数据搜索引擎中加入版本质量查询模块,用来根据词条查询百科数据库时,通过对与词条匹配的定义信息的版本质量进行查询,从而可以在形成的词条页面中还包括与词条匹配的定义信息的版本质量标识。在弹出窗口中也能够展示出与词条匹配的定义信息的版本质量标识来提示浏览用户其所看到的词条的定义信息的质量好坏,给浏览用户更全面的信息。
如图6所示,为本发明网页划词搜索系统的第二实施例的结构示意图。与上一实施例相比,本实施例中还包括词典数据库3。词典数据库3用于保存网络用户不可编辑的词条的定义信息。词条查询模块22还用于在查询所述百科数据库1时,如果查询不到与所述词条匹配的定义信息,则向所述词典数据库3进行查询。
词典数据库3中保存了一些网络用户不可编辑的知识型信息,这些信息的来源通常是一些传统的字词典(也包括百科全书等),由于这些字词典的编撰者和审查者具有较高的专业性和权威性,因此确保了这些传统载体中的信息的有效性和权威性。当百科数据库1中无法查询到词条相匹配的定义信息时,可以利用词典数据库3来进行词条的定义信息的查询,进而来弥补百科数据库1覆盖不全面和专业性差的缺陷。
当百科数据搜索引擎2在百科数据库1和词典数据库3均未查询到与被划选词条匹配的定义信息时,则在形成的词条页面中包括提示无搜索结果的信息,或形成的词条页面中包括所述词条相关的词条。
当百科数据搜索引擎查询到的结果中包括多个与词条匹配的定义信息时,词条页面形成模块23会按照各个定义信息的权重进行排序,优先在形成的词条页面中展示权重较高的定义信息。这里的多个定义信息可以是某个词条的多个词义,也可以是多种表现形式的定义信息,例如文字、图片、视频等。
如图7所示,为本发明网页划词搜索系统的第三实施例的结构示意图。由于定义信息可能有较大篇幅或者表现形式不适合通过弹出窗口实现,则可以在词条页面还包括链接到与词条匹配的定义信息的详细内容页面的超级链接。在本实施例中,百科数据搜索引擎还可以包括详细页面发送模块25,当详细页面发送模块25接收到用户终端点击该超级链接而发出的浏览请求,将所述详细内容页面发送到用户终端。
通过对用户点击超级链接,以及在详细内容页面的浏览行为的采集可以为动态调整搜索结果带来帮助。在本实施例的百科数据搜索引擎2中还可以包括权重调整模块26,用于在接收到与所述词条匹配的定义信息的详细内容页面的浏览请求时,记录与所述词条匹配的定义信息的有效浏览次数,并根据有效浏览累计次数调整与所述词条匹配的定义信息的权重。
这里的有效浏览次数主要是考虑网络用户在该详细内容页面的停留时间是否达到预设阈值,是否在该详细内容页面有复制操作等因素,被确认为有效浏览的详细内容页面则被计数,并且统计该详细内容页面的有效浏览累计次数(包括多个网络用户的有效浏览次数),对于某个词条来说,如果其多个定义信息中的某个定义信息的详细内容页面的有效浏览累计次数较高,则可以认为该详细内容页面更符合网络用户的阅读需求,因此可以根据该有效浏览累计次数调整与所述词条匹配的定义信息的权重,通过调整权重来调整在形成的词条页面中展示哪些定义信息,将多个网络用户的划词查询浏览的行为延展到划词查询得到的词条页面的显示内容,从而使后续进行划词查询的网络用户能够获得更直接有效的词条的定义信息。
整合网络用户的整体划词搜索和浏览行为,还可以进一步在网页内形成被划选词条的内部链接。在本实施例的百科数据搜索引擎2中还可以包括内链添加模块27,用于接收到与所述词条匹配的定义信息的详细内容页面的浏览请求时,记录与所述词条匹配的定义信息的有效浏览次数,当所述词条的单位有效浏览次数超过预设阈值,则在所述网页中添加所述词条的内部链接。
对于某些词条的定义信息的详细内容页面被多人进行有效浏览,其单位有效浏览次数超过预设阈值,换句话说,当判断在所有点击该详细内容页面的超级链接的次数中完成有效浏览的次数达到预设阈值时,则在该网页内添加该词条的内部链接,该内部链接将直接链接到该词条的详细内容页面。
通过内链添加,可以使多个网络用户的划词查询和浏览行为转化成经验行为,即多人的经验是该添加内链的词条可能与该网页有较高的相关度,因此有较高的查询价值,从而直接添加内链,省去其他网络用户划词查询的方式,而转化成直接点击的方式。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制;尽管参照较佳实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者对部分技术特征进行等同替换;而不脱离本发明技术方案的精神,其均应涵盖在本发明请求保护的技术方案范围当中。

Claims (18)

1.一种网页划词搜索方法,包括:
百科数据搜索引擎接收用户终端提交的在网页内划选的词条;
所述百科数据搜索引擎根据所述词条查询所述百科数据库,将查询到的与所述词条匹配的定义信息形成词条页面;
所述百科数据搜索引擎将所述词条页面发送到所述用户终端,以使所述用户终端进行展示。
2.根据权利要求1所述的网页划词搜索方法,其中在所述百科数据搜索引擎根据所述词条查询所述百科数据库时,如果查询不到与所述词条匹配的定义信息,则向词典数据库进行查询,将查询到的与词条匹配的定义信息形成词条页面。
3.根据权利要求1所述的网页划词搜索方法,其中当查询结果中包括多个与词条匹配的定义信息时,按照各个定义信息的权重进行排序,优先在形成的词条页面中展示权重较高的定义信息。
4.根据权利要求3所述的网页划词搜索方法,其中所述词条页面还包括链接到与所述词条匹配的定义信息的详细内容页面的超级链接,当接收到用户终端点击该超级链接而发出的浏览请求,将所述详细内容页面发送到所述用户终端。
5.根据权利要求4所述的网页划词搜索方法,其中接收到与所述词条匹配的定义信息的详细内容页面的浏览请求时,记录与所述词条匹配的定义信息的有效浏览次数,并根据有效浏览累计次数调整与所述词条匹配的定义信息的权重。
6.根据权利要求4所述的网页划词搜索方法,其中接收到与所述词条匹配的定义信息的详细内容页面的浏览请求时,记录与所述词条匹配的定义信息的有效浏览次数,当所述词条的单位有效浏览次数超过预设阈值,则在所述网页中添加所述词条的内部链接。
7.根据权利要求4所述的网页划词搜索方法,其中在用户终端提交在网页内划选的词条时,生成弹出窗口,在所述弹出窗口中以浮动层窗口方式进行展示所述用户终端接收到的所述词条页面。
8.根据权利要求7所述的网页划词搜索方法,其中在生成所述弹出窗口后,当捕捉到所述输入设备在所述弹出窗口或被划选的文本之外的区域的点击消息,则关闭所述包括所述词条页面的弹出窗口。
9.根据权利要求4所述的网页划词搜索方法,其中在所述百科数据搜索引擎根据所述词条查询所述百科数据库时,还对与所述词条匹配的定义信息的版本质量进行查询,在形成的词条页面中还包括与所述词条匹配的定义信息的版本质量标识。
10.根据权利要求2所述的网页划词搜索方法,其中当所述百科数据搜索引擎在所述百科数据库和词典数据库均未查询到与所述词条匹配的定义信息时,则在形成的词条页面中包括提示无搜索结果的信息,或形成的词条页面中包括所述词条相关的词条。
11.一种网页划词搜索系统,包括:
百科数据库,用于保存网络用户可编辑的词条的定义信息;
百科数据搜索引擎,用于接收用户终端提交的在网页内划选的词条,并根据所述词条查询所述百科数据库,并将查询到的与所述词条匹配的定义信息形成词条页面,并将所述词条页面发送到所述用户终端,以使所述用户终端进行展示。
12.根据权利要求11所述的网页划词搜索系统,其中所述百科数据搜索引擎具体包括:
词条输入接收模块,用于接收用户终端提交的在网页内划选的词条;
词条查询模块,用于根据所述词条查询所述百科数据库;
词条页面形成模块,用于根据查询结果中的与所述词条匹配的定义信息形成词条页面;
词条页面发送模块,用于将所述词条页面发送到所述用户终端,以使所述用户终端进行展示。
13.根据权利要求12所述的网页划词搜索系统,其中还包括:
词典数据库,用于保存网络用户不可编辑的词条的定义信息;
词条查询模块还用于在查询所述百科数据库时,如果查询不到与所述词条匹配的定义信息,则向所述词典数据库进行查询。
14.根据权利要求12所述的网页划词搜索系统,其中所述词条页面形成模块还用于在查询结果中包括多个词条的定义信息时,按照各个定义信息的权重进行排序,优先在形成的词条页面中展示权重较高的定义信息。
15.根据权利要求14所述的网页划词搜索系统,其中所述词条页面还包括链接到与所述词条匹配的定义信息的详细内容页面的超级链接,所述百科数据搜索引擎还包括:
详细页面发送模块,用于在接收到用户终端点击该超级链接而发出的浏览请求,将所述详细内容页面发送到所述用户终端。
16.根据权利要求14所述的网页划词搜索系统,其中所述百科数据搜索引擎还包括:
权重调整模块,用于在接收到与所述词条匹配的定义信息的详细内容页面的浏览请求时,记录与所述词条匹配的定义信息的有效浏览次数,并根据有效浏览累计次数调整与所述词条匹配的定义信息的权重。
17.根据权利要求14所述的网页划词搜索系统,其中所述百科数据搜索引擎还包括:
内链添加模块,用于接收到与所述词条匹配的定义信息的详细内容页面的浏览请求时,记录与所述词条匹配的定义信息的有效浏览次数,当所述词条的单位有效浏览次数超过预设阈值,则在所述网页中添加所述词条的内部链接。
18.根据权利要求12所述的网页划词搜索系统,其中所述百科数据搜索引擎还包括:
版本质量查询模块,用于对与所述词条匹配的定义信息的版本质量进行查询,在所述词条页面形成模块形成的词条页面中增加与所述词条匹配的定义信息的版本质量标识。
CN2010102223805A 2010-06-30 2010-06-30 网页划词搜索方法及系统 Pending CN102314456A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102223805A CN102314456A (zh) 2010-06-30 2010-06-30 网页划词搜索方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102223805A CN102314456A (zh) 2010-06-30 2010-06-30 网页划词搜索方法及系统

Publications (1)

Publication Number Publication Date
CN102314456A true CN102314456A (zh) 2012-01-11

Family

ID=45427634

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102223805A Pending CN102314456A (zh) 2010-06-30 2010-06-30 网页划词搜索方法及系统

Country Status (1)

Country Link
CN (1) CN102314456A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102855064A (zh) * 2012-08-10 2013-01-02 杨锦才 一种快速显示应用程序的功能控件帮助文档的方法
CN102929925A (zh) * 2012-09-20 2013-02-13 百度在线网络技术(北京)有限公司 一种基于浏览内容的搜索方法及装置
CN103399931A (zh) * 2013-08-07 2013-11-20 百度在线网络技术(北京)有限公司 搜索结果的提供方法、终端和系统及渲染方法
CN103455524A (zh) * 2012-06-05 2013-12-18 北京搜狗信息服务有限公司 展现和获取词条信息的方法和装置
CN104850608A (zh) * 2015-05-07 2015-08-19 深圳市世强先进科技有限公司 在信息展示页面上检索关键字的方法
CN104866545A (zh) * 2015-05-07 2015-08-26 深圳市世强先进科技有限公司 在信息展示页面上检索关键字的方法
CN106462596A (zh) * 2014-06-18 2017-02-22 谷歌公司 生成上下文搜索呈现
CN106708885A (zh) * 2015-11-17 2017-05-24 百度在线网络技术(北京)有限公司 一种实现搜索的方法和装置
CN107391667A (zh) * 2017-07-20 2017-11-24 维沃移动通信有限公司 一种词条处理方法及移动终端
CN107885888A (zh) * 2017-12-11 2018-04-06 北京百度网讯科技有限公司 信息处理方法及装置、终端设备以及计算机可读存储介质
WO2020082938A1 (zh) * 2018-10-23 2020-04-30 北京达佳互联信息技术有限公司 标签的处理方法、装置、电子设备及存储介质
CN111241844A (zh) * 2018-11-29 2020-06-05 北京搜狗科技发展有限公司 一种信息推荐方法及装置
CN113111112A (zh) * 2021-04-07 2021-07-13 南京东联智库科技有限公司 一种防务开源情报基础数据管理系统
CN114282494A (zh) * 2021-12-02 2022-04-05 北京达佳互联信息技术有限公司 信息显示方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6671681B1 (en) * 2000-05-31 2003-12-30 International Business Machines Corporation System and technique for suggesting alternate query expressions based on prior user selections and their query strings
CN1797301A (zh) * 2004-12-30 2006-07-05 陈沛 数字化信息搜索方法及其系统
CN101097578A (zh) * 2007-06-07 2008-01-02 北京金山软件有限公司 一种网络资源检索方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6671681B1 (en) * 2000-05-31 2003-12-30 International Business Machines Corporation System and technique for suggesting alternate query expressions based on prior user selections and their query strings
CN1797301A (zh) * 2004-12-30 2006-07-05 陈沛 数字化信息搜索方法及其系统
CN101097578A (zh) * 2007-06-07 2008-01-02 北京金山软件有限公司 一种网络资源检索方法及系统

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103455524A (zh) * 2012-06-05 2013-12-18 北京搜狗信息服务有限公司 展现和获取词条信息的方法和装置
CN103455524B (zh) * 2012-06-05 2021-06-22 北京搜狗信息服务有限公司 展现和获取词条信息的方法和装置
CN102855064B (zh) * 2012-08-10 2015-12-02 中国电信股份有限公司 一种快速显示应用程序的功能控件帮助文档的方法
CN102855064A (zh) * 2012-08-10 2013-01-02 杨锦才 一种快速显示应用程序的功能控件帮助文档的方法
CN102929925A (zh) * 2012-09-20 2013-02-13 百度在线网络技术(北京)有限公司 一种基于浏览内容的搜索方法及装置
CN103399931A (zh) * 2013-08-07 2013-11-20 百度在线网络技术(北京)有限公司 搜索结果的提供方法、终端和系统及渲染方法
CN103399931B (zh) * 2013-08-07 2017-07-25 百度在线网络技术(北京)有限公司 搜索结果的提供方法、终端和系统及渲染方法
US10394841B2 (en) 2014-06-18 2019-08-27 Google Llc Generating contextual search presentations
CN106462596A (zh) * 2014-06-18 2017-02-22 谷歌公司 生成上下文搜索呈现
CN104850608A (zh) * 2015-05-07 2015-08-19 深圳市世强先进科技有限公司 在信息展示页面上检索关键字的方法
CN104866545A (zh) * 2015-05-07 2015-08-26 深圳市世强先进科技有限公司 在信息展示页面上检索关键字的方法
CN104866545B (zh) * 2015-05-07 2018-08-10 深圳市世强元件网络有限公司 在信息展示页面上检索关键字的方法
CN106708885A (zh) * 2015-11-17 2017-05-24 百度在线网络技术(北京)有限公司 一种实现搜索的方法和装置
CN107391667A (zh) * 2017-07-20 2017-11-24 维沃移动通信有限公司 一种词条处理方法及移动终端
CN107391667B (zh) * 2017-07-20 2020-02-21 维沃移动通信有限公司 一种词条处理方法及移动终端
CN107885888A (zh) * 2017-12-11 2018-04-06 北京百度网讯科技有限公司 信息处理方法及装置、终端设备以及计算机可读存储介质
WO2020082938A1 (zh) * 2018-10-23 2020-04-30 北京达佳互联信息技术有限公司 标签的处理方法、装置、电子设备及存储介质
CN111241844A (zh) * 2018-11-29 2020-06-05 北京搜狗科技发展有限公司 一种信息推荐方法及装置
CN113111112A (zh) * 2021-04-07 2021-07-13 南京东联智库科技有限公司 一种防务开源情报基础数据管理系统
CN114282494A (zh) * 2021-12-02 2022-04-05 北京达佳互联信息技术有限公司 信息显示方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN102314456A (zh) 网页划词搜索方法及系统
US10275419B2 (en) Personalized search
US8244750B2 (en) Related search queries for a webpage and their applications
US9305100B2 (en) Object oriented data and metadata based search
CN103221951B (zh) 预测查询建议高速缓存
US8005832B2 (en) Search document generation and use to provide recommendations
US8799280B2 (en) Personalized navigation using a search engine
US20120059838A1 (en) Providing entity-specific content in response to a search query
US20070112792A1 (en) Personalized search and headlines
KR100896614B1 (ko) 검색 시스템 및 방법
US20090157618A1 (en) Entity networking system using displayed information for exploring connectedness of selected entities
KR20110000686A (ko) 컨텐츠 오브젝트와 통합하고, 연관짓고, 상호 작용하기 위한 오픈 프레임워크
CN102722498A (zh) 搜索引擎及其实现方法
EP1997065A1 (en) Mining web search user behavior to enhance web search relevance
CN102722501A (zh) 搜索引擎及其实现方法
CN102737021A (zh) 搜索引擎及其实现方法
CN102722499A (zh) 搜索引擎及其实现方法
US20100082594A1 (en) Building a topic based webpage based on algorithmic and community interactions
US20110161318A1 (en) Method and apparatus for assigning tags to digital content
US20120005185A1 (en) System and method for locating data feeds
US9530094B2 (en) Jabba-type contextual tagger
US20070067319A1 (en) System for building up hyperlinks of key words within text provided by content website
JP5416023B2 (ja) 閲覧端末及び方法
JP2006235882A (ja) 複数情報の閲覧方法およびシステム
Nazar Exploring SEO techniques for Web 2.0 websites

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120111