CN104484417B - 一种收藏夹信息的生成方法和装置 - Google Patents

一种收藏夹信息的生成方法和装置 Download PDF

Info

Publication number
CN104484417B
CN104484417B CN201410785315.1A CN201410785315A CN104484417B CN 104484417 B CN104484417 B CN 104484417B CN 201410785315 A CN201410785315 A CN 201410785315A CN 104484417 B CN104484417 B CN 104484417B
Authority
CN
China
Prior art keywords
information
result
object search
webpage
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410785315.1A
Other languages
English (en)
Other versions
CN104484417A (zh
Inventor
罗吉喜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201410785315.1A priority Critical patent/CN104484417B/zh
Publication of CN104484417A publication Critical patent/CN104484417A/zh
Application granted granted Critical
Publication of CN104484417B publication Critical patent/CN104484417B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9562Bookmark management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例提供了一种收藏夹信息的生成方法和装置,所述方法包括:接收第一搜索请求;所述第一搜索请求中包括第一用户标识和第一搜索对象;返回采用所述第一搜索对象进行搜索获得的第一搜索结果页面;接收通过所述第一搜索结果页面返回的一个或多个第一收藏夹信息;建立所述第一用户标识、所述第一搜索对象与所述一个或多第一收藏夹信息的第一关联关系。本发明实施例一方面,基于页面进行展示收藏夹信息,避免了安装特定的浏览器,提高了操作的简便性;另一方面,将第一搜索对象作为展示收藏夹信息的入口,避免了登录账号、加载某个网页直接加载收藏夹信息,大大提高了隐私性。

Description

一种收藏夹信息的生成方法和装置
技术领域
本发明涉及数据处理技术领域,特别是涉及一种收藏夹信息的生成方法和一种收藏夹信息的生成装置。
背景技术
随着网络科技的快速发展,尤其是进入了移动互联网时代,网络信息急剧增加,其中包括了大量的网页。
用户一般使用浏览器浏览网页,而浏览器一般提供收藏夹功能,收藏夹是在是上网的时候方便用户记录自己喜欢、常用的网页。把收藏夹信息放到一个文件夹里,想用的时候可以打开找到。
现在某些浏览器提供了网络存储收藏夹信息的功能,用户在不同的终端的同一浏览器中登录账号,就可以加载该账号在先收集的收藏夹信息。
这种收集收藏夹的方式,需要在不同终端中安装同一浏览器,操作繁琐,并且,登录账号后会显示该账号所有的收藏夹信息,隐私性很低。
此外,某些网站专门提供了网络收藏夹,该网站为用户分配一个网页,用户可以在该网页中收集收藏夹信息。
这种收集收藏夹的方式,虽然无需安装特定的浏览器,但是其他用户只要加载该网页,便可以获得该用户收集的收藏夹信息,隐私性十分低。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种收藏夹信息的生成方法和相应的一种收藏夹信息的生成装置。
依据本发明的一个方面,提供了一种收藏夹信息的生成方法,包括:
接收第一搜索请求;所述第一搜索请求中包括第一用户标识和第一搜索对象;
返回采用所述第一搜索对象进行搜索获得的第一搜索结果页面;
接收通过所述第一搜索结果页面返回的一个或多个第一收藏夹信息;
建立所述第一用户标识、所述第一搜索对象与所述一个或多第一收藏夹信息的第一关联关系。
可选地,所述方法还包括:
在所述第一关联关系中,对所述一个或多个第一收藏夹信息增加第一标签信息。
可选地,所述方法还包括:
当接收到针对所述一个或多个第一收藏夹信息的第一处理请求时,对所述一个或多个第一收藏夹信息配置第一特征网址信息。
可选地,所述方法还包括:
当接收到基于所述第一特征网址信息发送的第一加载请求时,返回所述一个或多个第一收藏夹信息。
可选地,所述第一收藏夹信息包括网址信息和名称。
可选地,所述返回采用所述第一搜索对象进行搜索获得的第一搜索结果页面的步骤包括:
当所述第一搜索对象为第一文本信息时,在数据库中搜索与所述第一文本信息匹配的第一网页;所述第一网页具有第一摘要信息;
采用所述第一网页的第一摘要信息生成第一搜索结果页面;
返回所述第一搜索结果页面。
可选地,所述返回采用所述第一搜索对象进行搜索获得的第一搜索结果页面的步骤包括:
当所述第一搜索对象为第一图像信息时,在数据库中识别与所述第一图像信息相似或相同的第一网页图像信息;
采用所述第一网页图像信息生成第一搜索结果页面;
返回所述第一搜索结果页面。
可选地,所述返回采用所述第一搜索对象进行搜索获得的第一搜索结果页面的步骤包括:
当所述第一搜索对象为第一音频数据时,识别出所述第一音频数据对应的第一特征文本信息;
在数据库中搜索与所述第一特征文本信息匹配的第二网页;所述第二网页具有第二摘要信息;
采用所述第二网页的第二摘要信息生成第一搜索结果页面;
返回所述第一搜索结果页面。
根据本发明的另一方面,提供了一种收藏夹信息的生成装置,包括:
第一接收模块,适于接收第一搜索请求;所述第一搜索请求中包括第一用户标识和第一搜索对象;
第一返回模块,适于返回采用所述第一搜索对象进行搜索获得的第一搜索结果页面;
第二接收模块,适于接收通过所述第一搜索结果页面返回的一个或多个第一收藏夹信息;
建立模块,适于建立所述第一用户标识、所述第一搜索对象与所述一个或多第一收藏夹信息的第一关联关系。
可选地,所述装置还包括:
增加模块,适于在所述第一关联关系中,对所述一个或多个第一收藏夹信息增加第一标签信息。
可选地,所述装置还包括:
第一配置模块,适于在接收到针对所述一个或多个第一收藏夹信息的第一处理请求时,对所述一个或多个第一收藏夹信息配置第一特征网址信息。
可选地,所述装置还包括:
第二返回模块,适于在接收到基于所述第一特征网址信息发送的第一加载请求时,返回所述一个或多个第一收藏夹信息。
可选地,所述第一收藏夹信息包括网址信息和名称。
可选地,所述第一返回模块还适于:
当所述第一搜索对象为第一文本信息时,在数据库中搜索与所述第一文本信息匹配的第一网页;所述第一网页具有第一摘要信息;
采用所述第一网页的第一摘要信息生成第一搜索结果页面;
返回所述第一搜索结果页面。
可选地,所述第一返回模块还适于:
当所述第一搜索对象为第一图像信息时,在数据库中识别与所述第一图像信息相似或相同的第一网页图像信息;
采用所述第一网页图像信息生成第一搜索结果页面;
返回所述第一搜索结果页面。
可选地,所述第一返回模块还适于:
当所述第一搜索对象为第一音频数据时,识别出所述第一音频数据对应的第一特征文本信息;
在数据库中搜索与所述第一特征文本信息匹配的第二网页;所述第二网页具有第二摘要信息;
采用所述第二网页的第二摘要信息生成第一搜索结果页面;
返回所述第一搜索结果页面。
本发明实施例在针对第一搜索请求,返回采用第一搜索对象进行搜索获得的第一搜索结果页面,在接收通过第一搜索结果页面返回的一个或多个第一收藏夹信息时,建立所述第一用户标识、第一搜索对象与一个或多第一收藏夹信息的第一关联关系,基于第一搜索对象采集收藏夹信息,以支持在后用户通过该第一搜索对象获得收藏夹信息,一方面,基于页面进行展示收藏夹信息,避免了安装特定的浏览器,提高了操作的简便性;另一方面,将第一搜索对象作为展示收藏夹信息的入口,避免了登录账号、加载某个网页直接加载收藏夹信息,大大提高了隐私性。
本发明实施例基于文本信息、图像信息、音频信息等作为搜索对象,文本信息可以方便输入,保证了简便性,图像信息、音频信息由于复杂程度较高,可以减少输入相同文本信息的几率,提高了搜索对象的复杂性,进一步提高了隐私性。
本发明实施例在关联关系中,对一个或多个收藏夹信息增加标签信息,支持用户通过匹配的标签订阅信息,以及,匹配的搜索对象,直接获得其他用户在先整理过的信息,由于人工整理的信息往往比搜索引擎机械返回的信息更加有效,避免了用户重复对海量的网页信息进行繁琐的人工过滤,减少了用户时间和精力的耗费,也减少了用户设备和网站的系统资源消耗,也减少了网络带宽的占用,大大提高了信息获取的效率、质量和容量。
本发明实施例为收藏夹信息配置特征网址信息,加载该特征网址信息则可以获得该收藏夹信息,直接获得其他用户在先整理过的信息,由于人工整理的信息往往比搜索引擎机械返回的信息更加有效,避免了用户重复对海量的网页信息进行繁琐的人工过滤,减少了用户时间和精力的耗费,也减少了用户设备和网站的系统资源消耗,也减少了网络带宽的占用,大大提高了信息获取的效率、质量和容量。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的一种收藏夹信息的生成方法实施例的步骤流程图;
图2示出了根据本发明一个实施例的一种添加收藏夹信息的示例图;
图3示出了根据本发明一个实施例的一种收藏夹信息的加载方法实施例的步骤流程图;
图4示出了根据本发明一个实施例的一种展示收藏夹信息的示例图;
图5示出了根据本发明一个实施例的一种添加标签订阅信息的示例图;
图6示出了根据本发明一个实施例的一种收藏夹信息的生成装置实施例的结构框图;以及
图7示出了根据本发明一个实施例的一种收藏夹信息的加载装置实施例的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
参照图1,示出了根据本发明一个实施例的一种收藏夹信息的生成方法实施例的步骤流程图,具体可以包括如下步骤:
步骤S101,接收第一搜索请求;
在具体实现中,用户可以从任何一种电子设备访问服务器(如搜索引擎),该电子设备具体可以包括移动设备,例如手机、PDA(Personal Digital Assistant,个人数字助理)、膝上型计算机、掌上电脑等等,也可以包括固定设备,例如个人计算机、智能电视等等。
这些电子设备可以支持包括Android(安卓)、IOS、WindowsPhone或者windows等的操作系统,通常可以运行浏览器或内置微型浏览器的应用程序。
第一搜索请求可以是指用户发出的搜索与某个搜索对象相关信息的指示。
例如,用户可以通过在搜索引擎的网页中输入某个搜索对象发起第一搜索请求,或者在浏览器的搜索插件(plug-ins,可以通过与浏览器、搜索引擎等进行交互,在浏览器中增加搜索功能)等输入某个搜索对象发起第一搜索请求等等。当用户在搜索引擎网页中点击搜索控件时,就相当于接收到发起基于搜索引擎的第一搜索请求的指示;同样,当在搜索插件中输入某个搜索对象并点击确定按钮或按下回车键时,也相当于接收到发起基于搜索引擎的第一搜索请求的指示。
其中,所述第一搜索请求中可以包括第一用户标识和第一搜索对象;
第一用户标识可以为能够代表一个唯一确定的用户的信息,例如,用户ID(IDentity的缩写,身份标识号码)、与用户ID绑定的其他信息,如邮箱、电话号码等等。
第一搜索对象可以包括文本信息、图片信息、音频信息等等,本发明实施例对此不加以限制。
在实际应用中浏览器或内置微型浏览器的应用程序可以将请求头信息通过HTTP(Hypertext transfer protocol,超文本传送协议)协议向搜索引擎所在的服务器发起第一搜索请求。该服务器接收到该请求之后等待处理,最后向浏览器或内置微型浏览器的应用程序返回响应。
步骤S102,返回采用所述第一搜索对象进行搜索获得的第一搜索结果页面;
本发明实施例中,当接收到用户提交的第一搜索对象时,则可以根据该第一搜索对象在数据库中快速检出相关的信息,进行信息与查询的相关度评价,对将要输出的结果进行排序并返回给浏览器或内置微型浏览器的应用程序。
在本发明的一种可选实施例中,步骤S102可以包括如下子步骤:
子步骤S11,当所述第一搜索对象为第一文本信息时,在数据库中搜索与所述第一文本信息匹配的第一网页;所述第一网页具有第一摘要信息;
子步骤S12,采用所述第一网页的第一摘要信息生成第一搜索结果页面;
子步骤S13,返回所述第一搜索结果页面。
在具体实现中,若第一搜索对象为文本信息,则可以基于倒排索引等方式搜索相关的网页。
以搜索引擎为例进行说明,搜索引擎的搜索流程分为二个部分,一是前端用户请求过程,二是后端制作数据过程。
一、前端用户请求过程:
1.接收请求:接收用户在搜索引擎输入的文本信息;
2.查询词分析:对文本信息进行分词处理;
3.检索:根据分词结果,从预先制作的倒排索引中,查找与分词结果相关的候选的网页;
4.排序:针对候选的网页,根据内容相关性、时效性等维度进行排序;
5.展现:将排序后的网页的摘要信息在搜索结果页面展现出来。
二、后端制作数据过程:
1.网页抓取:采用爬虫技术,通过网页间的链接关系,抓取互联网的网页并保存。
2.索引制作:对已抓取保存的网页进行分析,例如对网页标题和页面文本进行分词处理,根据分词结果制作倒排索引,供前端用户请求过程使用。
在本发明的一种可选实施例中,步骤S102可以包括如下子步骤:
子步骤S21,当所述第一搜索对象为第一图像信息时,在数据库中识别与所述第一图像信息相似或相同的第一网页图像信息;
子步骤S22,采用所述第一网页图像信息生成第一搜索结果页面;
子步骤S23,返回所述第一搜索结果页面。
在具体实现中,若第一搜索对象为图片信息,则可以通过图片相似度等方式查找相似或相同的网页图像信息。
在本发明实施例中,可以提取第一图像信息与第一网页图像信息中的特征信息进行相似度的计算。
其中,特征信息可以包括形状特征信息和颜色特征信息中的至少一种;形状特征信息可以指表征图像形状特性的信息,颜色特征信息可以指表征图像颜色特性的信息。
形状特征信息的表示方法主要有两类,一类是区域特征,其主要针对图像的整个形状区域;另一类是轮廓特征,其针对的是物体的外边界。
提取形状特征信息的典型方法包括边界特征值法(图像的外边界)、几何参数法(图像几何参数化处理)、形状不变矩法(找图像不变矩特征)、傅里叶形状描述法(傅里叶变换法)等等。
颜色特征信息可以是通过图像或图像区域的颜色特征来描述,它具有整体性。
提取颜色特征信息的典型方法包括颜色直方图、颜色集、颜色矩等等。
当然,上述特征信息只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他特征信息,本发明实施例对此不加以限制。
在本发明的一种可选实施例中,步骤S102可以包括如下子步骤:
子步骤S31,当所述第一搜索对象为第一音频数据时,识别出所述第一音频数据对应的第一特征文本信息;
子步骤S32,在数据库中搜索与所述第一特征文本信息匹配的第二网页;所述第二网页具有第二摘要信息;
子步骤S33,采用所述第二网页的第二摘要信息生成第一搜索结果页面;
子步骤S34,返回所述第一搜索结果页面。
在具体实现中,若第一搜索对象为音频数据,则可以识别出该音频数据对应的文本信息,再基于倒排索引等方式搜索相关的网页。
在实际应用中,电子设备可以通过麦克风等声卡设备采集用户发出的音频数据,或者,由电子设备直接上传已采集的音频数据,并通过语音识别技术(Automatic SpeechRecognition,ASR)将人类的语音中的词汇内容(即语音数据)转换为计算机可读的输入(即文本信息)。
目前,语音识别技术通常由语音识别系统实现。主流的大词汇量语音识别系统多采用统计模式识别技术。典型的基于统计模式识别方法的语音识别系统由以下几个基本模块所构成:
1、信号处理及特征提取模块;该模块的主要任务是从音频数据中提取特征,供声学模型处理。同时,它一般也包括了一些信号处理技术,以尽可能降低环境噪声、信道、说话人等因素对特征造成的影响。
2、声学模型;语音识别系统多采用基于一阶隐马尔科夫模型进行建模。
3、发音词典;发音词典包含语音识别系统所能处理的词汇集及其发音。发音词典实际提供了声学模型与语言模型的映射。
4、语言模型;语言模型对语音识别系统所针对的语言进行建模。理论上,包括正则语言,上下文无关文法在内的各种语言模型都可以作为语言模型,但目前各种系统普遍采用的还是基于统计的N元文法及其变体。
5、解码器;解码器是语音识别系统的核心之一,其任务是对输入的信号,根据声学、语言模型及词典,寻找能够以最大概率输出该信号的词串。从数学角度可以更加清楚的了解上述模块之间的关系。
当然,上述搜索对象及搜索方式只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他搜索对象及搜索方式,本发明实施例对此不加以限制。另外,除了上述搜索对象及搜索方式外,本领域技术人员还可以根据实际需要采用其它搜索对象及搜索方式,本发明实施例对此也不加以限制。
本发明实施例基于文本信息、图像信息、音频信息等作为搜索对象,文本信息可以方便输入,保证了简便性,图像信息、音频信息由于复杂程度较高,可以减少输入相同文本信息的几率,提高了搜索对象的复杂性,进一步提高了隐私性。
步骤S103,接收通过所述第一搜索结果页面返回的一个或多个第一收藏夹信息;
在HTTP协议下,浏览器或内置微型浏览器的应用程序可以从搜索引擎所在的服务器接收到HTML(Hypertext Markup Language,超文本标记语言)类型的文档。
浏览器或内置微型浏览器的应用程序可以解析HTML文档,生成树状结构的对象,即DOM(Document Object Model,文件对象模型),每个对象是DOM上的一个结点,而这些对象可以代表文字、图片等网页资源。浏览器或内置微型浏览器的应用程序可以开始显示此HTML文档,并获取其中内嵌的网页资源的地址,然后浏览器再向服务器发起请求来获取这些网页资源,并在浏览器或内置微型浏览器的应用程序的HTML文档中显示第一搜索结果页面。
在具体实现中,在第一搜索结果页面可以提供输入第一收藏夹信息的控件,用户可以通过该控件输入第一收藏夹信息。
其中,所述第一收藏夹信息包括可以网址信息和名称。
例如,如图2所示,若用户输入了第一搜索对象201“学习资料”,则在第一搜索结果页面中,可以提供如图5所示的控件501,或者,可以提供如图2所示的控件202和控件203,该控件202可以用于输入网址信息,该控件203可以用于输入名称,如可以在控件202中输入“library.ABC.com”、在控件203输入“图书馆”,则可以生成一个第一收藏夹信息;在控件202中输入“english.ABC.com”、在控件203输入“英语资料”,则可以生成一个第一收藏夹信息;在控件202中输入“chinese.ABC.com”、在控件203输入“语文资料”,则可以生成一个第一收藏夹信息等等。
步骤S104,建立所述第一用户标识、所述第一搜索对象与所述一个或多第一收藏夹信息的第一关联关系。
在具体实现中,搜索引擎可以建立第一用户标识、第一搜索对象与一个或多第一收藏夹信息的第一关联关系,存储在数据库中,以确认生成收藏夹信息。
由于该一个或多个收藏夹信息归属于同一个第一搜索对象,象形地,可以将第一关联关系称之为收藏盒子,该第一搜索对象可以为打开这个收藏盒子的钥匙。
本发明实施例在针对第一搜索请求,返回采用第一搜索对象进行搜索获得的第一搜索结果页面,在接收通过第一搜索结果页面返回的一个或多个第一收藏夹信息时,建立所述第一用户标识、第一搜索对象与一个或多第一收藏夹信息的第一关联关系,基于第一搜索对象采集收藏夹信息,以支持在后用户通过该第一搜索对象获得收藏夹信息,一方面,基于页面进行展示收藏夹信息,避免了安装特定的浏览器,提高了操作的简便性;另一方面,将第一搜索对象作为展示收藏夹信息的入口,避免了登录账号、加载某个网页直接加载收藏夹信息,大大提高了隐私性。
在本发明的一种可选实施例中,还可以包括如下步骤:
步骤S105,在所述第一关联关系中,对所述一个或多个第一收藏夹信息增加第一标签信息。
在实际应用中,收藏盒子(即第一关联关系)中的收藏第一收藏夹信息慢慢多起来之后,可以给每个收藏盒子(即第一关联关系)打上第一标签信息。
例如,对于“library.ABC.com”、“图书馆”,“english.ABC.com”、“英语资料”,“chinese.ABC.com”、“语文资料”这些收藏夹信息,可以配置“大学资料”这个第一标签信息。
在一种情况中,可以在第一搜索结果页面中提供一控件,例如,图4所示的控件402,用户可以通过该控件手动添加第一标签信息。
在另一种情况中,可以在用户授权的情况下,搜索引擎自动添加第一标签信息。
具体而言,搜索引擎可以采用自然语言处理技术(Natural LanguageProcessing,NLP)分析网址信息对应的网页后添加第一标签信息。其中,自然语言处理寄宿大致分为两个层面,一个是浅层分析,如分词,词性标注,通常只需对网址信息对应的网页的局部范围进行分析处理;另一个层面是对语言进行深层的处理,需要对网址信息对应的网页进行全局分析,在分析时通常对句法、语义以及语用这三个层次进行分析。
本发明实施例在关联关系中,对一个或多个第一收藏夹信息增加标签信息,支持用户通过匹配的标签订阅信息,以及,匹配的搜索对象,直接获得其他用户在先整理过的信息,由于人工整理的信息往往比搜索引擎机械返回的信息更加有效,避免了用户重复对海量的网页信息进行繁琐的人工过滤,减少了用户时间和精力的耗费,也减少了用户设备和网站的系统资源消耗,也减少了网络带宽的占用,大大提高了信息获取的效率、质量和容量。
在本发明的一种可选实施例中,还可以包括如下步骤:
步骤S106,当接收到针对所述一个或多个第一收藏夹信息的第一处理请求时,对所述一个或多个第一收藏夹信息配置第一特征网址信息。
步骤S107,当接收到基于所述第一特征网址信息发送的第一加载请求时,返回所述一个或多个第一收藏夹信息。
在本发明实施例中,当前用户所收藏的第一收藏夹信息,可以分享给其他用户。
例如,用户还是个骑行新手的时候,可以向老资历的骑行者询问,请求推荐几个骑行者论坛,以获得更快捷、更多的资讯。
具体而言,当前用户可以通过浏览器或内置微型浏览器的应用程序向搜索引擎发出第一处理请求,请求对第一收藏夹信息(如骑行者论坛)配置第一特征网址信息,以分享其他用户。
搜索引擎可以为该第一收藏夹信息(如骑行者论坛)配置第一特征网址信息,并返回给浏览器或内置微型浏览器的应用程序。
当前用户获得第一特征网址信息,则可以通过邮件、即时通讯工具、论坛、微博等途径将其分发给其他用户。
其他用户可以通过加载第一特征网址信息,获得当前用户收藏的第一收藏夹信息(如骑行者论坛)。
本发明实施例在关联关系中,对一个或多个第一收藏夹信息增加标签信息,支持用户通过匹配的标签订阅信息,以及,匹配的搜索对象,直接获得其他用户在先整理过的信息,由于人工整理的信息往往比搜索引擎机械返回的信息更加有效,避免了用户重复对海量的网页信息进行繁琐的人工过滤,减少了用户时间和精力的耗费,也减少了用户设备和网站的系统资源消耗,也减少了网络带宽的占用,大大提高了信息获取的效率、质量和容量。
参照图3,示出了根据本发明一个实施例的一种收藏夹信息的加载方法实施例的步骤流程图,具体可以包括如下步骤:
步骤S301,接收第二搜索请求;
在具体实现中,用户可以从任何一种电子设备访问服务器(如搜索引擎),该电子设备具体可以包括移动设备,例如手机、PDA(Personal Digital Assistant,个人数字助理)、膝上型计算机、掌上电脑等等,也可以包括固定设备,例如个人计算机、智能电视等等。
这些电子设备可以支持包括Android(安卓)、IOS、WindowsPhone或者windows等的操作系统,通常可以运行浏览器或内置微型浏览器的应用程序。
第二搜索请求可以是指用户发出的搜索与某个搜索对象相关信息的指示。
例如,用户可以通过在搜索引擎的网页中输入某个搜索对象发起第二搜索请求,或者在浏览器的搜索插件(plug-ins,可以通过与浏览器、搜索引擎等进行交互,在浏览器中增加搜索功能)等输入某个搜索对象发起第二搜索请求等等。当用户在搜索引擎网页中点击搜索控件时,就相当于接收到发起基于搜索引擎的第二搜索请求的指示;同样,当在搜索插件中输入某个搜索对象并点击确定按钮或按下回车键时,也相当于接收到发起基于搜索引擎的第二搜索请求的指示。
其中,所述第二搜索请求中可以包括第二用户标识和第二搜索对象;
第二用户标识可以为能够代表一个唯一确定的用户的信息,例如,用户ID(IDentity的缩写,身份标识号码)、与用户ID绑定的其他信息,如邮箱、电话号码等等。
第二搜索对象可以包括文本信息、图片信息、音频信息等等,本发明实施例对此不加以限制。
在实际应用中浏览器或内置微型浏览器的应用程序可以将请求头信息通过HTTP(Hypertext transfer protocol,超文本传送协议)协议向搜索引擎所在的服务器发起第一搜索请求。该服务器接收到该请求之后等待处理,最后向浏览器或内置微型浏览器的应用程序返回响应。
步骤S302,采用所述第二搜索对象进行搜索,获得搜索第二结果页面;
本发明实施例中,当接收到用户提交的第二搜索对象时,则可以根据该第二搜索对象在数据库中快速检出相关的信息,进行信息与查询的相关度评价,对将要输出的结果进行排序。
在本发明的一种可选实施例中,步骤S302可以包括如下子步骤:
子步骤S41,当所述第二搜索对象为第二文本信息时,在数据库中搜索与所述第二文本信息匹配的第三网页;所述第三网页具有第三摘要信息;
子步骤S42,采用所述第三网页的第三摘要信息生成第二搜索结果页面。
在具体实现中,若第二搜索对象为文本信息,则可以基于倒排索引等方式搜索相关的网页。
以搜索引擎为例进行说明,搜索引擎的搜索流程分为二个部分,一是前端用户请求过程,二是后端制作数据过程。
一、前端用户请求过程:
1.接收请求:接收用户在搜索引擎输入的文本信息;
2.查询词分析:对文本信息进行分词处理;
3.检索:根据分词结果,从预先制作的倒排索引中,查找与分词结果相关的候选的网页;
4.排序:针对候选的网页,根据内容相关性、时效性等维度进行排序;
5.展现:将排序后的网页的摘要信息在搜索结果页面展现出来。
二、后端制作数据过程:
1.网页抓取:采用爬虫技术,通过网页间的链接关系,抓取互联网的网页并保存。
2.索引制作:对已抓取保存的网页进行分析,例如对网页标题和页面文本进行分词处理,根据分词结果制作倒排索引,供前端用户请求过程使用。
在本发明的一种可选实施例中,步骤S302可以包括如下子步骤:
子步骤S51,当所述第二搜索对象为第二图像信息时,在数据库中识别与所述第二图像信息相似或相同的第二网页图像信息;
子步骤S52,采用所述第二网页图像信息生成第二搜索结果页面。
在具体实现中,若第二搜索对象为图片信息,则可以通过图片相似度等方式查找相似或相同的网页图像信息。
在本发明实施例中,可以提取第二图像信息与第二网页图像信息中的特征信息进行相似度的计算。
其中,特征信息可以包括形状特征信息和颜色特征信息中的至少一种;形状特征信息可以指表征图像形状特性的信息,颜色特征信息可以指表征图像颜色特性的信息。
形状特征信息的表示方法主要有两类,一类是区域特征,其主要针对图像的整个形状区域;另一类是轮廓特征,其针对的是物体的外边界。
提取形状特征信息的典型方法包括边界特征值法(图像的外边界)、几何参数法(图像几何参数化处理)、形状不变矩法(找图像不变矩特征)、傅里叶形状描述法(傅里叶变换法)等等。
颜色特征信息可以是通过图像或图像区域的颜色特征来描述,它具有整体性。
提取颜色特征信息的典型方法包括颜色直方图、颜色集、颜色矩等等。
当然,上述特征信息只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他特征信息,本发明实施例对此不加以限制。
在本发明的一种可选实施例中,步骤S302可以包括如下子步骤:
子步骤S61,当所述第二搜索对象为第二音频数据时,识别出所述第二音频数据对应的第二特征文本信息;
子步骤S62,在数据库中搜索与所述第二特征文本信息匹配的第四网页;所述第四网页具有第四摘要信息;
子步骤S63,采用所述第四网页的第四摘要信息生成第二搜索结果页面。
在具体实现中,若第二搜索对象为音频数据,则可以识别出该音频数据对应的文本信息,再基于倒排索引等方式搜索相关的网页。
在实际应用中,电子设备可以通过麦克风等声卡设备采集用户发出的音频数据,或者,由电子设备直接上传已采集的音频数据,并通过语音识别技术(Automatic SpeechRecognition,ASR)将人类的语音中的词汇内容(即语音数据)转换为计算机可读的输入(即文本信息)。
目前,语音识别技术通常由语音识别系统实现。主流的大词汇量语音识别系统多采用统计模式识别技术。典型的基于统计模式识别方法的语音识别系统由以下几个基本模块所构成:
1、信号处理及特征提取模块;该模块的主要任务是从音频数据中提取特征,供声学模型处理。同时,它一般也包括了一些信号处理技术,以尽可能降低环境噪声、信道、说话人等因素对特征造成的影响。
2、声学模型;语音识别系统多采用基于一阶隐马尔科夫模型进行建模。
3、发音词典;发音词典包含语音识别系统所能处理的词汇集及其发音。发音词典实际提供了声学模型与语言模型的映射。
4、语言模型;语言模型对语音识别系统所针对的语言进行建模。理论上,包括正则语言,上下文无关文法在内的各种语言模型都可以作为语言模型,但目前各种系统普遍采用的还是基于统计的N元文法及其变体。
5、解码器;解码器是语音识别系统的核心之一,其任务是对输入的信号,根据声学、语言模型及词典,寻找能够以最大概率输出该信号的词串。从数学角度可以更加清楚的了解上述模块之间的关系。
当然,上述搜索对象及搜索方式只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他搜索对象及搜索方式,本发明实施例对此不加以限制。另外,除了上述搜索对象及搜索方式外,本领域技术人员还可以根据实际需要采用其它搜索对象及搜索方式,本发明实施例对此也不加以限制。
本发明实施例基于文本信息、图像信息、音频信息等作为搜索对象,文本信息可以方便输入,保证了简便性,图像信息、音频信息由于复杂程度较高,可以减少输入相同文本信息的几率,提高了搜索对象的复杂性,进一步提高了隐私性。
步骤S303,在预设的第二关联关系中查找与所述第二用户标识和所述第二搜索对象关联的一个或多个第二收藏夹信息;
应用本发明实施例,用户可以预先通过第二搜索对象收藏一个或多个第二收藏夹信息,搜索引擎可以建立第二用户标识、第二搜索对象和一个或多个第二收藏夹信息的第二关联关系。
通过该第二关联关系,可以查找出与第二用户标识和第二搜索对象关联的一个或多个第二收藏夹信息。
步骤S304,将所述一个或多个第二收藏夹信息嵌入所述第二搜索结果页面中;
步骤S305,返回所述第二搜索结果页面。
在本发明实施例中,搜索引擎将可以将一个或多个第二收藏夹信息嵌入第二搜索结果页面中并返回给浏览器或内置微型浏览器的应用程序。
在HTTP协议下,浏览器或内置微型浏览器的应用程序可以从搜索引擎所在的服务器接收到HTML(Hypertext Markup Language,超文本标记语言)类型的文档。
浏览器或内置微型浏览器的应用程序可以解析HTML文档,生成树状结构的对象,即DOM(Document Object Model,文件对象模型),每个对象是DOM上的一个结点,而这些对象可以代表文字、图片等网页资源。浏览器或内置微型浏览器的应用程序可以开始显示此HTML文档,并获取其中内嵌的网页资源的地址,然后浏览器再向服务器发起请求来获取这些网页资源,并在浏览器或内置微型浏览器的应用程序的HTML文档中显示第二搜索结果页面。
在具体实现中,所述第二收藏夹信息可以包括网址信息和名称。
例如,如图4所示,若用户输入了第二搜索对象401“学习资料”,则可以在第二搜索结果页面中,提供控件403和控件404,该控件403可以用于加载名称,该控件404可以用于加载网址信息,如可以在控件404中加载“library.ABC.com”、在控件403中加载“图书馆”;在控件404中加载“english.ABC.com”、在控件403中加载“英语资料”;在控件404中加载“chinese.ABC.com”、在控件403中加载“语文资料”等等。
需要说明的是,当在浏览器或内置微型浏览器中加载了用户在先收集的第二收藏夹信息,用户可以继续通过如图4所示的控件405继续添加收藏夹信息,本发明实施例对此不加以限制。
当用户点击第二收藏夹信息(如网址信息)时,则可以在新的窗口加载对应的页面。
本发明实施例针对接收第二搜索请求,采用第二搜索对象进行搜索,获得搜索第二结果页面,在预设的第二关联关系中查找与第二用户标识和第二搜索对象关联的一个或多个第二收藏夹信息,将一个或多个第二收藏夹信息嵌入第二搜索结果页面中并返回,一方面,基于页面进行展示收藏夹信息,避免了安装特定的浏览器,提高了操作的简便性;另一方面,将第一搜索对象作为展示收藏夹信息的入口,避免了登录账号、加载某个网页直接加载收藏夹信息,大大提高了隐私性。
在本发明的一种可选实施例中,还可以包括如下步骤:
步骤S306,当所述第二用户标识具有关联的第一标签订阅信息时,查找与所述第二关联关系匹配的一个或多个第三关联关系;
应用本发明实施例,用户可以提交第一标签订阅信息,以订阅感兴趣的标签信息。例如,可以点击如图5所示的控件502,提交“玄幻小说”、“骑行爱好者”、“校园笑话”、“大学资料”等等第一标签订阅信息。
基于搜索的情景,当前用户可以更加便捷地获取所需的资讯。例如,当前用户是个饮食爱好者,订阅饮食类的标签订阅信息,该用户搜索某个地方或某个菜式时,可以搜索更多的美食资讯;当前用户是个旅游爱好者,订阅旅游类的标签订阅信息,该用户搜索某个地方时,可以搜索当地更多的旅游资讯。
在具体实现中,所述第三关联关系为第三用户标识、第三搜索对象与一个或多个第三收藏夹信息的关联关系,所述一个或多个第三收藏夹信息具有第二标签信息;所述第一标签订阅信息与所述第二标签信息匹配和/或所述第二搜索对象与所述第三搜索对象匹配;
在本发明实施例的一种可选示例中,所述第三收藏夹信息可以包括网址信息和名称。
在本发明实施例中,在判断第一标签订阅信息与第二标签信息、第二搜索对象与第三搜索对象是否匹配时,是根据预设的匹配规则进行判断的。
该预设的匹配规则是自然语言处理分析规则,或者,也是正则表达式规则,或者,也是二者的结合。
其中,自然语言处理分析规则大致分为两个层面,一个是浅层分析,如分词,词性标注,通常只需对句子的局部范围进行分析处理;另一个层面是对语言进行深层的处理,需要对句子进行全局分析,在分析时通常对句法、语义以及语用这三个层次进行分析。
正则表达式规则一般是通过一些具有特定含义的字符来表示匹配规则的,例如,字符“^”匹配一个输入或一行的开头,如“^a”匹配“an A”,而不匹配“An a”;字符“$”匹配一个输入或一行的结尾,如“a$”匹配“An a”,而不匹配“an A”;字符“*”匹配前面元字符0次或多次,如“ba*”将匹配“b”,“ba”,“baa”以及“baaa”等。
通常情况下,自然语言处理分析规则主要用来解决同义词的问题,正则表达式规则主要用来处理长尾词。另外,还自定义一些匹配规则。
通过匹配规则的设置,准确地确定与第一标签订阅信息、第二搜索对象相匹配的第二标签信息、第三搜索对象,而且,当第一标签订阅信息、第二搜索对象有少许偏差,例如,第二搜索对象中有一个错别字或丢掉了一个字,这时,根据自然语言处理分析规则,仍然确定出用户实际想要的关键词。
例如,若在先其他用户为第三收藏夹信息配置了“大学资料”这个第二标签信息,该第三收藏夹信息对应“学习资料”这个第三搜索对象,则当前用户在订阅了“大学资料”这个第一标签信息,且,搜索“学习资料”这个第二搜索对象时,则可以获得在先其他用户收藏的第三收藏夹信息,诸如“library.ABC.com”、“图书馆”,“english.ABC.com”、“英语资料”,“chinese.ABC.com”、“语文资料”等等。
步骤S307、从所述一个或多个第二关联关系中提取所述一个或多个第三收藏夹信息;
在本发明实施例中,可以提取个第三收藏夹信息以分享给其他用户。
在本发明的一种可选实施例中,步骤S307可以包括如下子步骤:
子步骤S41,对所述一个或多个第二关联关系中的第三收藏夹信息进行对比;
子步骤S42,提取一个或多个相同的第三收藏夹信息。
在具体实现中,若第三收藏夹信息比较多,则可以提取相同的第三收藏夹信息分享当前用户。
进一步地,本发明实施例还可以提取一个或多个出现频次高于预设阈值或频次最高的一个或多个的第三收藏夹信息分享当前用户,本发明实施例对此不加以限制。
步骤S308、将所述一个或多个第三收藏夹信息嵌入所述第二搜索结果页面中。
将述一个或多个第三收藏夹信息嵌入第二搜索结果页面中,返回给浏览器或内置微型浏览器的应用程序,进而进行展示。
本发明实施例在关联关系中,对一个或多个收藏夹信息增加标签信息,支持用户通过匹配的标签订阅信息,以及,匹配的搜索对象,直接获得其他用户在先整理过的信息,由于人工整理的信息往往比搜索引擎机械返回的信息更加有效,避免了用户重复对海量的网页信息进行繁琐的人工过滤,减少了用户时间和精力的耗费,也减少了用户设备和网站的系统资源消耗,也减少了网络带宽的占用,大大提高了信息获取的效率、质量和容量。
在本发明的一种可选实施例中,还可以包括如下步骤:
步骤S309,当接收到针对所述一个或多个第二收藏夹信息的第二处理请求时,对所述一个或多个第二收藏夹信息配置第二特征网址信息。
步骤S310,当接收到基于所述第二特征网址信息发送的第二加载请求时,返回所述一个或多个第二收藏夹信息。
在本发明实施例中,当前用户所收藏的第二收藏夹信息,可以分享给其他用户。
例如,用户还是个骑行新手的时候,可以向老资历的骑行者询问,请求推荐几个骑行者论坛,以获得更快捷、更多的资讯。
具体而言,当前用户可以通过浏览器或内置微型浏览器的应用程序(如点击图4所示的控件406)向搜索引擎发出第二处理请求,请求对第二收藏夹信息(如骑行者论坛)配置第二特征网址信息,以分享其他用户。
搜索引擎可以为该第二收藏夹信息(如骑行者论坛)配置第二特征网址信息,并返回给浏览器或内置微型浏览器的应用程序。
当前用户获得第二特征网址信息,则可以通过邮件、即时通讯工具、论坛、微博等途径将其分发给其他用户。
其他用户可以通过加载第二特征网址信息,获得当前用户收藏的第二收藏夹信息(如骑行者论坛)。
本发明实施例为收藏夹信息配置特征网址信息,加载该特征网址信息则可以获得该收藏夹信息,直接获得其他用户在先整理过的信息,由于人工整理的信息往往比搜索引擎机械返回的信息更加有效,避免了用户重复对海量的网页信息进行繁琐的人工过滤,减少了用户时间和精力的耗费,也减少了用户设备和网站的系统资源消耗,也减少了网络带宽的占用,大大提高了信息获取的效率、质量和容量。
对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图6,示出了根据本发明一个实施例的一种收藏夹信息的生成装置实施例的结构框图,具体可以包括如下模块:
第一接收模块601,适于接收第一搜索请求;所述第一搜索请求中包括第一用户标识和第一搜索对象;
第一返回模块602,适于返回采用所述第一搜索对象进行搜索获得的第一搜索结果页面;
第二接收模块603,适于接收通过所述第一搜索结果页面返回的一个或多个第一收藏夹信息;
建立模块604,适于建立所述第一用户标识、所述第一搜索对象与所述一个或多第一收藏夹信息的第一关联关系。
在本发明的一种可选实施例中,还可以包括如下模块:
增加模块,适于在所述第一关联关系中,对所述一个或多个第一收藏夹信息增加第一标签信息。
在本发明的一种可选实施例中,还可以包括如下模块:
第一配置模块,适于在接收到针对所述一个或多个第一收藏夹信息的第一处理请求时,对所述一个或多个第一收藏夹信息配置第一特征网址信息。
在本发明的一种可选实施例中,还可以包括如下模块:
第二返回模块,适于在接收到基于所述第一特征网址信息发送的第一加载请求时,返回所述一个或多个第一收藏夹信息。
在本发明的一种可选实施例中,所述第一收藏夹信息可以包括网址信息和名称。
在本发明的一种可选实施例中,所述第一返回模块602还可以适于:
当所述第一搜索对象为第一文本信息时,在数据库中搜索与所述第一文本信息匹配的第一网页;所述第一网页具有第一摘要信息;
采用所述第一网页的第一摘要信息生成第一搜索结果页面;
返回所述第一搜索结果页面。
在本发明的一种可选实施例中,所述第一返回模块602还可以适于:
当所述第一搜索对象为第一图像信息时,在数据库中识别与所述第一图像信息相似或相同的第一网页图像信息;
采用所述第一网页图像信息生成第一搜索结果页面;
返回所述第一搜索结果页面。
在本发明的一种可选实施例中,所述第一返回模块602还可以适于:
当所述第一搜索对象为第一音频数据时,识别出所述第一音频数据对应的第一特征文本信息;
在数据库中搜索与所述第一特征文本信息匹配的第二网页;所述第二网页具有第二摘要信息;
采用所述第二网页的第二摘要信息生成第一搜索结果页面;
返回所述第一搜索结果页面。
参照图7,示出了根据本发明一个实施例的一种收藏夹信息的加载装置实施例的结构框图,具体可以包括如下模块:
第三接收模块701,适于接收第二搜索请求;所述第二搜索请求中包括第二用户标识和第二搜索对象;
获得模块702,适于采用所述第二搜索对象进行搜索,获得搜索第二结果页面;
第一查找模块703,适于在预设的第二关联关系中查找与所述第二用户标识和所述第二搜索对象关联的一个或多个第二收藏夹信息;
第一嵌入模块704,适于将所述一个或多个第二收藏夹信息嵌入所述第二搜索结果页面中;
第三返回模块705,适于返回所述第二搜索结果页面。
在本发明的一种可选实施例中,还可以包括如下模块:
第二查找模块,适于在所述第二用户标识具有关联的第一标签订阅信息时,查找与所述第二关联关系匹配的一个或多个第三关联关系;所述第三关联关系为第三用户标识、第三搜索对象与一个或多个第三收藏夹信息的关联关系,所述一个或多个第三收藏夹信息具有第二标签信息;所述第一标签订阅信息与所述第二标签信息匹配和/或所述第二搜索对象与所述第三搜索对象匹配;
提取模块,适于从所述一个或多个第三关联关系中提取所述一个或多个第三收藏夹信息;
第二嵌入模块,适于将所述一个或多个第三收藏夹信息嵌入所述第二搜索结果页面中。
在本发明的一种可选实施例中,提取模块还可以适于:
对所述一个或多个第三关联关系中的第三收藏夹信息进行对比;
提取一个或多个相同的第三收藏夹信息。
在本发明的一种可选实施例中,还可以包括如下模块:
第二配置模块,适于在接收到针对所述一个或多个第二收藏夹信息的第二处理请求时,对所述一个或多个第二收藏夹信息配置第二特征网址信息。
在本发明的一种可选实施例中,还可以包括如下模块:
第四返回模块,适于在接收到基于所述第二特征网址信息发送的第二加载请求时,返回所述一个或多个第二收藏夹信息。
在本发明的一种可选实施例中,所述第二收藏夹信息可以包括网址信息和名称,所述第三收藏夹信息可以包括网址信息和名称。
在本发明的一种可选实施例中,所述获得模块702还可以适于:
当所述第二搜索对象为第二文本信息时,在数据库中搜索与所述第二文本信息匹配的第三网页;所述第三网页具有第三摘要信息;
采用所述第三网页的第三摘要信息生成第二搜索结果页面。
在本发明的一种可选实施例中,所述获得模块702还可以适于:
当所述第二搜索对象为第二图像信息时,在数据库中识别与所述第二图像信息相似或相同的第二网页图像信息;
采用所述第二网页图像信息生成第二搜索结果页面。
在本发明的一种可选实施例中,所述获得模块702还可以适于:
当所述第二搜索对象为第二音频数据时,识别出所述第二音频数据对应的第二特征文本信息;
在数据库中搜索与所述第二特征文本信息匹配的第四网页;所述第四网页具有第四摘要信息;
采用所述第四网页的第四摘要信息生成第二搜索结果页面。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的收藏夹信息的生成设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明实施例公开了A1、一种收藏夹信息的生成方法,包括:
接收第一搜索请求;所述第一搜索请求中包括第一用户标识和第一搜索对象;
返回采用所述第一搜索对象进行搜索获得的第一搜索结果页面;
接收通过所述第一搜索结果页面返回的一个或多个第一收藏夹信息;
建立所述第一用户标识、所述第一搜索对象与所述一个或多第一收藏夹信息的第一关联关系。
A2、如A1所述的方法,还包括:
在所述第一关联关系中,对所述一个或多个第一收藏夹信息增加第一标签信息。
A3、如A1所述的方法,还包括:
当接收到针对所述一个或多个第一收藏夹信息的第一处理请求时,对所述一个或多个第一收藏夹信息配置第一特征网址信息。
A4、如A3所述的方法,还包括:
当接收到基于所述第一特征网址信息发送的第一加载请求时,返回所述一个或多个第一收藏夹信息。
A5、如A1或A2或A3或A4所述的方法,所述第一收藏夹信息包括网址信息和名称。
A6、如A1或A2或A3或A4所述的方法,所述返回采用所述第一搜索对象进行搜索获得的第一搜索结果页面的步骤包括:
当所述第一搜索对象为第一文本信息时,在数据库中搜索与所述第一文本信息匹配的第一网页;所述第一网页具有第一摘要信息;
采用所述第一网页的第一摘要信息生成第一搜索结果页面;
返回所述第一搜索结果页面。
A7、如A1或A2或A3或A4所述的方法,所述返回采用所述第一搜索对象进行搜索获得的第一搜索结果页面的步骤包括:
当所述第一搜索对象为第一图像信息时,在数据库中识别与所述第一图像信息相似或相同的第一网页图像信息;
采用所述第一网页图像信息生成第一搜索结果页面;
返回所述第一搜索结果页面。
A8、如A1或A2或A3或A4所述的方法,所述返回采用所述第一搜索对象进行搜索获得的第一搜索结果页面的步骤包括:
当所述第一搜索对象为第一音频数据时,识别出所述第一音频数据对应的第一特征文本信息;
在数据库中搜索与所述第一特征文本信息匹配的第二网页;所述第二网页具有第二摘要信息;
采用所述第二网页的第二摘要信息生成第一搜索结果页面;
返回所述第一搜索结果页面。
本发明实施例还公开了B9、一种收藏夹信息的生成装置,包括:
第一接收模块,适于接收第一搜索请求;所述第一搜索请求中包括第一用户标识和第一搜索对象;
第一返回模块,适于返回采用所述第一搜索对象进行搜索获得的第一搜索结果页面;
第二接收模块,适于接收通过所述第一搜索结果页面返回的一个或多个第一收藏夹信息;
建立模块,适于建立所述第一用户标识、所述第一搜索对象与所述一个或多第一收藏夹信息的第一关联关系。
B10、如B9所述的装置,还包括:
增加模块,适于在所述第一关联关系中,对所述一个或多个第一收藏夹信息增加第一标签信息。
B1、如B9所述的装置,还包括:
第一配置模块,适于在接收到针对所述一个或多个第一收藏夹信息的第一处理请求时,对所述一个或多个第一收藏夹信息配置第一特征网址信息。
B12、如B11所述的装置,还包括:
第二返回模块,适于在接收到基于所述第一特征网址信息发送的第一加载请求时,返回所述一个或多个第一收藏夹信息。
B13、如B9或B10或B11或B12所述的装置,所述第一收藏夹信息包括网址信息和名称。
B14、如B9或B10或B11或B12所述的装置,所述第一返回模块还适于:
当所述第一搜索对象为第一文本信息时,在数据库中搜索与所述第一文本信息匹配的第一网页;所述第一网页具有第一摘要信息;
采用所述第一网页的第一摘要信息生成第一搜索结果页面;
返回所述第一搜索结果页面。
B15、如B9或B10或B11或B12所述的装置,所述第一返回模块还适于:
当所述第一搜索对象为第一图像信息时,在数据库中识别与所述第一图像信息相似或相同的第一网页图像信息;
采用所述第一网页图像信息生成第一搜索结果页面;
返回所述第一搜索结果页面。
B16、如B9或B10或B11或B12所述的装置,所述第一返回模块还适于:
当所述第一搜索对象为第一音频数据时,识别出所述第一音频数据对应的第一特征文本信息;
在数据库中搜索与所述第一特征文本信息匹配的第二网页;所述第二网页具有第二摘要信息;
采用所述第二网页的第二摘要信息生成第一搜索结果页面;
返回所述第一搜索结果页面。

Claims (18)

1.一种收藏夹信息的生成方法,包括:
接收第一搜索请求;所述第一搜索请求中包括第一用户标识和第一搜索对象;
返回采用所述第一搜索对象进行搜索获得的第一搜索结果页面;
接收通过所述第一搜索结果页面返回的一个或多个第一收藏夹信息;
建立所述第一用户标识、所述第一搜索对象与所述一个或多个第一收藏夹信息的第一关联关系。
2.如权利要求1所述的方法,其特征在于,还包括:
在所述第一关联关系中,对所述一个或多个第一收藏夹信息增加第一标签信息。
3.如权利要求1所述的方法,其特征在于,还包括:
当接收到针对所述一个或多个第一收藏夹信息的第一处理请求时,对所述一个或多个第一收藏夹信息配置第一特征网址信息。
4.如权利要求3所述的方法,其特征在于,还包括:
当接收到基于所述第一特征网址信息发送的第一加载请求时,返回所述一个或多个第一收藏夹信息。
5.如权利要求1或2或3或4所述的方法,其特征在于,所述第一收藏夹信息包括网址信息和名称。
6.如权利要求1或2或3或4所述的方法,其特征在于,所述返回采用所述第一搜索对象进行搜索获得的第一搜索结果页面的步骤包括:
当所述第一搜索对象为第一文本信息时,在数据库中搜索与所述第一文本信息匹配的第一网页;所述第一网页具有第一摘要信息;
采用所述第一网页的第一摘要信息生成第一搜索结果页面;
返回所述第一搜索结果页面。
7.如权利要求1或2或3或4所述的方法,其特征在于,所述返回采用所述第一搜索对象进行搜索获得的第一搜索结果页面的步骤包括:
当所述第一搜索对象为第一图像信息时,在数据库中识别与所述第一图像信息相似或相同的第一网页图像信息;
采用所述第一网页图像信息生成第一搜索结果页面;
返回所述第一搜索结果页面。
8.如权利要求1或2或3或4所述的方法,其特征在于,所述返回采用所述第一搜索对象进行搜索获得的第一搜索结果页面的步骤包括:
当所述第一搜索对象为第一音频数据时,识别出所述第一音频数据对应的第一特征文本信息;
在数据库中搜索与所述第一特征文本信息匹配的第二网页;所述第二网页具有第二摘要信息;
采用所述第二网页的第二摘要信息生成第一搜索结果页面;
返回所述第一搜索结果页面。
9.一种收藏夹信息的生成装置,包括:
第一接收模块,适于接收第一搜索请求;所述第一搜索请求中包括第一用户标识和第一搜索对象;
第一返回模块,适于返回采用所述第一搜索对象进行搜索获得的第一搜索结果页面;
第二接收模块,适于接收通过所述第一搜索结果页面返回的一个或多个第一收藏夹信息;
建立模块,适于建立所述第一用户标识、所述第一搜索对象与所述一个或多个第一收藏夹信息的第一关联关系。
10.如权利要求9所述的装置,其特征在于,还包括:
增加模块,适于在所述第一关联关系中,对所述一个或多个第一收藏夹信息增加第一标签信息。
11.如权利要求9所述的装置,其特征在于,还包括:
第一配置模块,适于在接收到针对所述一个或多个第一收藏夹信息的第一处理请求时,对所述一个或多个第一收藏夹信息配置第一特征网址信息。
12.如权利要求11所述的装置,其特征在于,还包括:
第二返回模块,适于在接收到基于所述第一特征网址信息发送的第一加载请求时,返回所述一个或多个第一收藏夹信息。
13.如权利要求9或10或11或12所述的装置,其特征在于,所述第一收藏夹信息包括网址信息和名称。
14.如权利要求9或10或11或12所述的装置,其特征在于,所述第一返回模块还适于:
当所述第一搜索对象为第一文本信息时,在数据库中搜索与所述第一文本信息匹配的第一网页;所述第一网页具有第一摘要信息;
采用所述第一网页的第一摘要信息生成第一搜索结果页面;
返回所述第一搜索结果页面。
15.如权利要求9或10或11或12所述的装置,其特征在于,所述第一返回模块还适于:
当所述第一搜索对象为第一图像信息时,在数据库中识别与所述第一图像信息相似或相同的第一网页图像信息;
采用所述第一网页图像信息生成第一搜索结果页面;
返回所述第一搜索结果页面。
16.如权利要求9或10或11或12所述的装置,其特征在于,所述第一返回模块还适于:
当所述第一搜索对象为第一音频数据时,识别出所述第一音频数据对应的第一特征文本信息;
在数据库中搜索与所述第一特征文本信息匹配的第二网页;所述第二网页具有第二摘要信息;
采用所述第二网页的第二摘要信息生成第一搜索结果页面;
返回所述第一搜索结果页面。
17.一种电子设备,其中,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行所述权利要求1-8中任一项所述的方法。
18.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行所述权利要求1-8中任一项所述的方法。
CN201410785315.1A 2014-12-16 2014-12-16 一种收藏夹信息的生成方法和装置 Active CN104484417B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410785315.1A CN104484417B (zh) 2014-12-16 2014-12-16 一种收藏夹信息的生成方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410785315.1A CN104484417B (zh) 2014-12-16 2014-12-16 一种收藏夹信息的生成方法和装置

Publications (2)

Publication Number Publication Date
CN104484417A CN104484417A (zh) 2015-04-01
CN104484417B true CN104484417B (zh) 2018-05-04

Family

ID=52758958

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410785315.1A Active CN104484417B (zh) 2014-12-16 2014-12-16 一种收藏夹信息的生成方法和装置

Country Status (1)

Country Link
CN (1) CN104484417B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737613A (zh) * 2020-06-22 2020-10-02 浙江大搜车软件技术有限公司 App页面收藏方法、装置、计算机设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1936896A (zh) * 2006-09-20 2007-03-28 网之易信息技术(北京)有限公司 一种基于搜索引擎的信息检索方法及检索系统
CN101216748A (zh) * 2007-12-29 2008-07-09 深圳华为通信技术有限公司 输入方法和装置
CN101517556A (zh) * 2006-07-14 2009-08-26 查查检索有限公司 用于共享和访问资源的方法和系统
CN102722481A (zh) * 2011-03-29 2012-10-10 阿里巴巴集团控股有限公司 一种用户收藏夹数据的处理方法及搜索方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002230035A (ja) * 2001-01-05 2002-08-16 Internatl Business Mach Corp <Ibm> 情報整理方法、情報処理装置、情報処理システム、記憶媒体、およびプログラム伝送装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101517556A (zh) * 2006-07-14 2009-08-26 查查检索有限公司 用于共享和访问资源的方法和系统
CN1936896A (zh) * 2006-09-20 2007-03-28 网之易信息技术(北京)有限公司 一种基于搜索引擎的信息检索方法及检索系统
CN101216748A (zh) * 2007-12-29 2008-07-09 深圳华为通信技术有限公司 输入方法和装置
CN102722481A (zh) * 2011-03-29 2012-10-10 阿里巴巴集团控股有限公司 一种用户收藏夹数据的处理方法及搜索方法

Also Published As

Publication number Publication date
CN104484417A (zh) 2015-04-01

Similar Documents

Publication Publication Date Title
US20200301954A1 (en) Reply information obtaining method and apparatus
CN107346336B (zh) 基于人工智能的信息处理方法和装置
KR102288249B1 (ko) 정보 처리 방법, 단말기, 및 컴퓨터 저장 매체
KR101605430B1 (ko) 문답 데이터베이스 구축 시스템 및 방법, 그리고 이를 이용한 검색 시스템 및 방법
CN106776503B (zh) 文本语义相似度的确定方法及装置
CN108280114B (zh) 一种基于深度学习的用户文献阅读兴趣分析方法
CN104735468B (zh) 一种基于语义分析将图像合成新视频的方法及系统
CN111507099A (zh) 文本分类方法、装置、计算机设备及存储介质
CN110008378B (zh) 基于人工智能的语料收集方法、装置、设备及存储介质
CN111831802B (zh) 一种基于lda主题模型的城市领域知识检测系统及方法
CN107704453A (zh) 一种文字语义分析方法、文字语义分析终端及存储介质
CN108509465A (zh) 一种视频数据的推荐方法、装置和服务器
CN113590850A (zh) 多媒体数据的搜索方法、装置、设备及存储介质
CN105979376A (zh) 一种推荐方法和装置
US10311120B2 (en) Method and apparatus for identifying webpage type
CN106383875A (zh) 基于人工智能的人机交互方法和装置
CN112015928B (zh) 多媒体资源的信息提取方法、装置、电子设备及存储介质
CN103116635B (zh) 面向领域的暗网资源采集方法和系统
CN107766234A (zh) 一种基于移动设备的网页健康度的测评方法、装置及系统
CN111523324A (zh) 命名实体识别模型的训练方法及装置
CN113806588A (zh) 搜索视频的方法和装置
CN113038153A (zh) 金融直播违规检测方法、装置、设备及可读存储介质
CN112347339A (zh) 一种搜索结果处理方法及装置
CN117520522B (zh) 一种基于rpa和ai结合的智能对话方法、装置及电子设备
CN108595466B (zh) 一种互联网信息过滤以及互联网用户信息和网帖结构分析方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220725

Address after: Room 801, 8th floor, No. 104, floors 1-19, building 2, yard 6, Jiuxianqiao Road, Chaoyang District, Beijing 100015

Patentee after: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Address before: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park)

Patentee before: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Patentee before: Qizhi software (Beijing) Co.,Ltd.

TR01 Transfer of patent right