CN106339394B - 一种信息处理方法及装置 - Google Patents

一种信息处理方法及装置 Download PDF

Info

Publication number
CN106339394B
CN106339394B CN201510401747.2A CN201510401747A CN106339394B CN 106339394 B CN106339394 B CN 106339394B CN 201510401747 A CN201510401747 A CN 201510401747A CN 106339394 B CN106339394 B CN 106339394B
Authority
CN
China
Prior art keywords
search
correlation coefficient
video
unit
click rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510401747.2A
Other languages
English (en)
Other versions
CN106339394A (zh
Inventor
安明洋
程起飞
骆志军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Beijing Co Ltd
Original Assignee
Tencent Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Beijing Co Ltd filed Critical Tencent Technology Beijing Co Ltd
Priority to CN201510401747.2A priority Critical patent/CN106339394B/zh
Publication of CN106339394A publication Critical patent/CN106339394A/zh
Application granted granted Critical
Publication of CN106339394B publication Critical patent/CN106339394B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings

Abstract

本发明公开了一种信息处理方法及装置,其中所述方法包括:获取待搜索的关键词,所述关键词为用户通过搜索引擎进行搜索视频的视频属性信息;根据所述关键词在索引数据库中搜索,得到搜索条目;获取所述搜索条目的相关度,所述相关度是关于总点击量和预设时间段内的点击量的函数;按照相关度从大到小的顺序对所述搜索条目排序,得到排序结果;获取搜索条目的内容,所述搜索条目的内容包括视频的链接地址和视频摘要;按照所述排序结果和所述搜索条目的内容生成搜索结果;将所述搜索结果输出。

Description

一种信息处理方法及装置
技术领域
本发明涉及搜索引擎技术,尤其涉及一种信息处理方法及装置。
背景技术
随着移动网络的快速发展,终端已经成为人们日常生活中必不可少的娱乐媒介。其中在终端上观看视频成为娱乐、休闲的重要项目。在视频网站通过搜索引擎里面搜索视频,是人们获取自己需要的视频的重要方式。用户在视频网站通过搜索引擎得到用户想看的视频的流程,如图1-1所示,一般包括下面几个步骤:
步骤S101,用户在搜索框中输入关键词;
具体地,用户打开视频网站,在视频网站的搜索引擎的搜索框中输入关键词,关键词可以是视频的名称等其他的属性信息,如果视频为电视剧或电影,视频的属性信息包括演员名字、导演的名字等信息,如果视频为歌曲MV,那么视频的属性信息包括歌手、作曲、作词、MV主演等信息。
步骤S102,终端获取关键词;
这里,终端上安装有视频网站的客户端,或者安装有浏览器,能够在终端上运行视频客户端或者能够在终端上打开视频网站,其中客户端可以以应用程序(APP)的形成安装在终端。终端根据用户的输入,获取视频的关键词。
步骤S103,终端将关键词携带于请求消息中;
这里,所述请求消息是指搜索请求消息,对应地,响应消息是指搜索响应消息。
步骤S104,终端向服务器发送请求消息;
这里,终端向视频服务器发送请求消息,该请求消息用于请求服务器根据携带的关键词搜索相关的结果。
步骤S105,服务器接收终端发送的请求消息;
步骤S106,服务器从请求消息中获取关键词;
这里,服务器解析所述请求消息,从解析的结果吃获取关键词。
步骤S107,服务器根据关键词进行搜索,得到搜索结果;
这里,服务器从索引数据库中找到符合该关键词的所有相关网页。最后综合网页的相关信息和网页级别形成相关度数值,然后根据相关度的大小进行排序,形成搜索结果;其中网页的相关信息包括网页的链接地址和页面内容摘要等内容,排序时相关度越高排名越靠前。
步骤S108,服务器将搜索结果携带在响应消息中;
步骤S109,终端接收服务器发送的响应消息;
步骤S110,终端从响应消息中获取搜索结果;
步骤S111,终端显示搜索结果;
这里,终端将搜索结果显示在终端的显示屏上;
步骤S112,用户点击查看某一项搜索结果。
然而,用户通过图1-1所示的方式得到用户自己想看的视频,结果却不尽人意,因为,每一项搜索结果的相关度直接影响该条结果在显示页面的先后顺序,用户习惯于查看前面显示页面的第1至2页的搜索结果,对于排序靠后的搜索结果,或许用户根本不会去点击查看。所以说,一条结果的相关度数值的大小,直接影响搜索引擎的搜索质量,然而现在的相关度却不能很好地对页面相关信息进行排序,例如现有技术中,相关度与点击量的大小成正比,对于刚刚杀青的电视剧或电影来说,这类电视剧或电影的相关搜素结果点击量非常小,因此,符合用户心意的搜索结果往往比较靠后,因为之前的用户很少有人去搜索,或者很少有人知道这类电视剧或电影。
为了克服上述的问题,以及应对各种各样突如其来的需求,同时能够搜索引擎提供的搜索结果更加满足用户的心意,相关技术中在搜索引擎中设计并实现了人工干预系统。所谓人工干预系统,就是对搜索引擎返回的搜索结果,通过人为的操作干预,强制决定其中某一条搜索结果的排序提前或靠后。人工干预系统的优点是:可以通过人的逻辑判断,对某些关键词(query又称搜索词)召回的搜索结果,进行更加合理的排序,弥补搜索引擎返回的搜索结果中的一些不足,提高搜索结果的点击率和转化,进而提高搜索质量。但是,这样人工干预也有其难以避免的缺点:其一,因为操作人员对结果判断的局限性,无法真正代替用户,也就无法完全按照用户的搜索意图进行干预,可能会造成干预结果不准确,无法提高搜索的质量;其二,因为需要人亲自操作,这其中有一个发现的过程,无法实时地对线上用户的意图做响应。
发明内容
有鉴于此,本发明实施例为解决现有技术中存在的至少一个问题而提供一种信息处理方法及装置,能够较为准确地分析和响应用户的真正搜索意图,从而提高搜索引擎返回的搜索结果的质量,进而提高用户体验。
本发明实施例的技术方案是这样实现的:
第一方面,本发明实施例提供一种信息处理方法,所述方法包括:
获取待搜索的关键词,所述关键词为用户通过搜索引擎进行搜索视频的视频属性信息;
根据所述关键词在索引数据库中搜索,得到搜索条目;
获取所述搜索条目的相关度,所述相关度是关于总点击量和预设时间段内的点击量的函数;
按照相关度从大到小的顺序对所述搜索条目排序,得到排序结果;
获取搜索条目的内容,所述搜索条目的内容包括视频的链接地址和视频摘要;
按照所述排序结果和所述搜索条目的内容生成搜索结果;
将所述搜索结果输出。
第二方面,本发明实施例提供一种信息处理方法,所述方法还包括:
获取用于表明用户对搜索结果的响应的反馈信息,所述反馈信息中携带有关键词和响应集合中搜索条目的标识信息,所述响应集合为用户响应搜索结果中的搜索条目的集合;
根据所述响应集合中搜索条目的标识信息对所述搜索结果中对应的搜索条目的总点击量和预设时间段内的点击量进行更新;
获取所述函数中第一相关系数和第二相关系数;
根据第一相关系数、第二相关系数、总点击量和预设时间段内的点击量,计算所述搜索结果中搜索条目的相关度。
第三方面,本发明实施例提供一种信息处理装置,所述装置包括第一获取单元、搜索单元、第二获取单元、排序单元、第三获取单元、生成单元和输出单元,其中:
所述第一获取单元,用于获取待搜索的关键词,所述关键词为用户通过搜索引擎进行搜索视频的视频属性信息;
所述搜索单元,用于根据所述关键词在索引数据库中搜索,得到搜索条目;
所述第二获取单元,用于获取所述搜索条目的相关度,所述相关度是关于总点击量和预设时间段内的点击量的函数;
所述排序单元,用于按照相关度从大到小的顺序对所述搜索条目排序,得到排序结果;
所述第三获取单元,用于获取搜索条目的内容,所述搜索条目的内容包括视频的链接地址和视频摘要;
所述生成单元,用于按照所述排序结果和所述搜索条目的内容生成搜索结果;
所述输出单元,用于输出所述搜索结果。
第四方面,本发明实施例提供一种信息处理装置,所述装置还包括第四获取单元、更新单元、第五获取单元和计算单元,其中:
所述第四获取单元,用于获取用于表明用户对搜索结果的响应的反馈信息,所述反馈信息中携带有关键词和响应集合中搜索条目的标识信息,所述响应集合为用户响应搜索结果中的搜索条目的集合;
所述更新单元,用于根据所述响应集合中搜索条目的标识信息对所述搜索结果中对应的搜索条目的总点击量和预设时间段内的点击量进行更新;
所述第五获取单元,用于获取所述函数中第一相关系数和第二相关系数;
所述计算单元,用于根据第一相关系数、第二相关系数、总点击量和预设时间段内的点击量,计算所述搜索结果中搜索条目的相关度。
本发明实施例提供的一种信息处理方法及装置,其中,获取待搜索的关键词,所述关键词为用户通过搜索引擎进行搜索视频的视频属性信息;根据所述关键词在索引数据库中搜索,得到搜索条目;获取所述搜索条目的相关度,所述相关度是关于总点击量和预设时间段内的点击量的函数;按照相关度从大到小的顺序对所述搜索条目排序,得到排序结果;获取搜索条目的内容,所述搜索条目的内容包括视频的链接地址和视频摘要;按照所述排序结果和所述搜索条目的内容生成搜索结果;将所述搜索结果输出;如此,能够较为准确地分析和响应用户的真正搜索意图,从而提高搜索引擎返回的搜索结果的质量,进而提高用户体验。
附图说明
图1-1为相关技术中用户在视频网站通过搜索引擎得到用户想看的视频的流程示意图;
图1-2为相关技术中搜索引擎的组成结构示意图;
图1-3为本发明实施例一信息处理方法的实现流程示意图;
图1-4为相关技术搜索引擎采用C/S结构的示意图;
图2为本发明实施例二信息处理方法的实现流程示意图;
图3为本发明实施例三计算搜索条目的相关度的实现流程示意图;
图4为本发明实施例四信息处理方法的实现流程示意图;
图5为本发明实施例五信息处理方法的实现流程示意图;
图6为本发明实施例七信息处理装置的组成结构示意图;
图7为本发明实施例八信息处理装置的组成结构示意图;
图8为本发明实施例九计算搜索条目的相关度的装置的组成结构示意图。
具体实施方式
为了解决背景技术中存在的技术问题,下面先来介绍一下搜索引擎(SearchEngine),搜索引擎是一种基于web平台的网络查找工具。因此,关于搜索引擎的概念可从不同的角度来理解。从信息组织的角度看,搜索引擎是一种网络信息资源的二次组织工具,它是将分布在不同网络服务器上的大量信息重新归类组织成易于查询的形式。从信息检索的角度看,搜索引擎是一种用以查询互联网中各类信息资源的在线检索平台,并以web网页的方式组织和呈现检索结果。但是对于开发者来说,搜索引擎是以Web相关技术为基础进行抓取与采集网页上的网络信息资源,建立索引数据库,然后依据用户的查找需求检索网络信息并将结果显示给用户,是为用户提供在线检索服务的web查找系统。
搜索引擎作为一个系统,一方面,搜索引擎系统可以根据工作时效性的不同划分为离线子系统和在线子系统两部分。另一方面,如图1-2所示,搜索引擎系统还可以依据具体功能的差别将搜索引擎分解成四个关键模块:用户接口模块10、信息检索模块20、索引处理模块30和信息采集模块40。通常情况下索引处理模块30和信息搜集模块40属于离线子系统的范畴,而用户接口模块10、信息检索模块20则属于搜索引擎的在线子系统的范畴。从程序角度来看,一个搜索引擎一般包括采集器41、索引器31、检索器21和用户接口模块10四个部分组成:
(1)采集器41,又称搜索器、蜘蛛(Spider)、机器人(Robot)、爬行者(Crawler)或蠕虫(Worm)等,搜索器实质是一种计算机程序,按照某种策略自动地在互联网中搜集和发现web信息,或者从其他文档43上搜索和发现信息资源,进而形成数据库42。搜索器需要尽可能多、尽可能快地搜集各种类型的新信息,同时由于网上的信息更新很快,需要定期更新已经搜集过的旧信息,以避免死链接和无效链接。
(2)索引器31,索引器用于生成从关键词到统一资源定位器(URL,UniformResource Locator)地址的关系索引表。索引表一般使用某种形式的倒排表(InversionList)或顺排表,即由索引项查找相应的URL。一个搜索引擎的有效性在很大程序上取决于索引的质量。
(3)检索器21,检索器的主要功能是根据用户输入的关键词,在索引器形成的倒排表或顺排表中进行查询,同时完成页面与查询之间的相关度评价,对将要输出的结果进行排序,并提供某种用户相关性的反馈机制。
(4)用户接口模块10,用户接口模块的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制。
用户11或12至1N提交要搜索的关键字(即发送搜索请求),然后搜索引擎就会经过查询处理与分词,然后由检索器21从索引数据库中找到符合该关键词的所有视频的相关信息。最后综合视频的相关信息和网页级别形成相关度数值,然后进行排序,相关度越高排名越靠前(即形成检索结果集22)。最后由用户接口模块10中的页面生成子模块将检索结果集的链接地址和页面内容摘要等内容组织起来返回给用户(返回搜索结果)。
在搜索引擎中相关度的计算是提供检索服务的关键。索引数据生成是由索引处理模块30来实现的,目前离线索引数据生成大都是基于分布式计算的架构。本发明实施例提供的技术方案将基于相关度的计算,提高搜索引擎的服务质量。
下面结合附图和具体实施例对本发明的技术方案进一步详细阐述。
实施例一
本发明实施例提供一种信息处理方法,该信息处理方法可以应用于计算设备,该信息处理方法所实现的功能可以通过计算设备中的处理器调用程序代码来实现,当然程序代码可以保存在计算机存储介质中,可见,该计算设备至少包括处理器和存储介质。在具体实施的过程中,所述计算设备可以为个人计算机(PC)、工控机、智能手机、平板电脑等,其中个人计算机包括台式计算机、桌面电脑、一体式计算机(AIO,All In One)、笔记本电脑等。
图1-3为本发明实施例一信息处理方法的实现流程示意图,如图1-3所示,该信息处理方法包括:
步骤S121,计算设备获取待搜索的关键词,所述关键词为用户通过搜索引擎进行搜索视频的视频属性信息;
这里,一般来说,搜索引擎都是基于客户端服务器(Client Server Model,C/S)的,即客户端作为一种应用程序安装在终端上,C/S结构的搜索引擎可参见图1-4所示的架构,终端52通过网络51连接服务器53,用户通过安装在终端51上的客户端输入关键词,然后客户端将搜索请求发送给服务器53,其中搜索请求中携带有用户输入的关键词,由服务器53根据搜索请求中的关键词进行搜索,得到搜索结果后返回给终端51,最终有终端51将搜索结果呈现给用户。C/S结构中的服务器一般存储有巨大的数据量,以及比终端强大的处理能力,因此,终端不必耗费自身资源,只需要向服务器发送搜索请求,并接收服务器发送的搜索结果,然后向用户展示搜索结果即可。对于搜索量不是很大,处理起来并不复杂的搜索来说,搜索引擎也可以不是基于C/S结构,换句话说,搜索引擎都是在终端本地来实现的,终端接收到关键词后进行搜索,然后将搜索结果呈现给用户。基于前述的描述,当搜索引擎采用C/S结构,本发明实施例的提供的技术方案是在服务器侧实现的;当搜索引擎不是采用C/S结构,本发明实施例的提供的技术方案是在电子设备端实现的。
这里,所述视频属性信息可以是视频的名称,如果视频为电视剧或电影,视频的属性信息包括演员名字、导演的名字、编剧、投资方、上映日期等信息,如果视频为歌曲MV,那么视频的属性信息包括歌手、作曲、作词、MV主演等信息。如果视频为自拍视频或拍客提供的视频,除了视频名称外,还可以有视频提供者、上传日期等信息。
步骤S122,计算设备根据所述关键词在索引数据库中搜索,得到搜索条目;
这里,所述搜索条目可以是视频的标识信息,其中视频的标识信息可以为视频的编号信息、视频的名称、视频的类别等属性信息,在具体实施的过程中,可以利用视频的编码信息建立搜索条目,这样比较简洁。索引数据库中建立了搜索条目与关键词之间的对应关系,因此,可以根据关键词查询索引数据库中的对应关系,得到搜索条目。
步骤S123,计算设备获取所述搜索条目的相关度,所述相关度是关于总点击量和预设时间段内的点击量的函数;
这里,在具体实施的过程中,相关度可以采用下面的公式(1)进行计算:
相关度y=a1×x1+a2×x2+a3×x3+a4×x4+…+an×xn (1);
公式(1)中,x1、x2、x3、x4和xn为影响相关度的一些因素,例如,总点击量、网页级别、预设时间段内的点击量、视频的时长,a1、a2、a3、a4、和an为对应因素的相关系数。在公式(1)中,当因素只包括总点击量和预设时间段内的点击量时,公式(1)即可简化为y=a1×x1+a2×x2,其中x1为总点击量,x2为预设时间段内的点击量,a1为总点击量的相关系数(第一相关系数),a2为预设时间段内的点击量的相关系数(第二相关系数)。作为一种优选的实施例,第一相关系数大于等于第二相关系数。
需要说明的是,本领域的技术人员除了根据公式(1)得到相关度外,还可以根据各种现有技术来计算搜索条目的相关度,这里不再赘述。
这里,预设时间段内的点击量可以为预设的某一段时间内的点击量,其中预设时间段可以为最近的一段时间内,例如,从现在或过去某一时刻开始过去24小时之内,从当前时刻过去一周之内等。本领域的技术人员可以根据具体情况对预设时间段的具体数值进行设置,这里不再赘述。
步骤S124,计算设备按照相关度从大到小的顺序对所述搜索条目排序,得到排序结果;
步骤S125,计算设备获取搜索条目的内容,所述搜索条目的内容包括视频的链接地址和视频摘要;
这里,视频摘要一般包括视频的名称、视频的代表性画面,视频名称和视频的代表性画面连接有视频的链接地址。
步骤S126,计算设备按照所述排序结果和所述搜索条目的内容生成搜索结果;
在步骤S126中,先将视频的链接地址嵌入到视频摘要中,然后按照排序结果将嵌入有视频链接地址的视频摘要生成页面,将页面作为搜索结果。
步骤S127,计算设备输出所述搜索结果。
本发明实施例中,相关度越大,在输出的搜索结果的时候,显示越靠前,用户一般从前到后的顺序,浏览搜索结果,当视频摘要与用户的期望比较接近时,用户就会点击视频摘要,一般来说,视频的摘要带有视频的链接地址,当用户点击视频摘要,终端即跳转到视频的链接地址,然后终端为用户打开的视频,用户开始观看视频。
本发明实施例中,获取待搜索的关键词,所述关键词为用户通过搜索引擎进行搜索视频的视频属性信息;根据所述关键词在索引数据库中搜索,得到搜索条目;获取所述搜索条目的相关度,所述相关度是关于总点击量和预设时间段内的点击量的函数;按照相关度从大到小的顺序对所述搜索条目排序,得到排序结果;获取搜索条目的内容,所述搜索条目的内容包括视频的链接地址和视频摘要;按照所述排序结果和所述搜索条目的内容生成搜索结果;将所述搜索结果输出;如此,能够较为准确地分析和响应用户的真正搜索意图,从而提高搜索引擎返回的搜索结果的质量,进而提高用户体验。
实施例二
基于前述的实施例一,本发明实施例提供一种信息处理方法,该方法中,以搜索引擎是基于C/S结构为例,图2为本发明实施例二信息处理方法的实现流程示意图,如图2所示,该方法包括:
步骤S201,用户在搜索框中输入关键词;
步骤S202,终端获取关键词;
步骤S203,将关键词携带于搜索请求消息中;
步骤S204,终端向服务器发送第一请求消息;
这里,上述的步骤S201至步骤204分别对应于图1-1中的步骤S101至步骤104,因此,本领域的技术人员可以参阅图1-1而理解上述的步骤S201至步骤S204,为节约篇幅,这里不再赘述。
步骤S205,服务器接收终端发送的第一请求消息;
这里,所述第一请求消息中携带有待搜索的关键词;
步骤S206,服务器解析终端发的所述第一请求消息,得到所述关键词;
这里,上述的步骤S205至步骤S206实际上提供一种实现步骤S121“服务器获取待搜索的关键词”的方式。
这里,所述关键词为用户通过搜索引擎进行搜索视频的视频属性信息;
步骤S207,服务器根据所述关键词在索引数据库中搜索,得到搜索条目;
步骤S208,服务器获取所述搜索条目的相关度,所述相关度是关于总点击量和预设时间段内的点击量的函数;
步骤S209,服务器按照相关度从大到小的顺序对所述搜索条目排序,得到排序结果;
步骤S210,服务器获取搜索条目的内容,所述搜索条目的内容包括视频的链接地址和视频摘要;
步骤S211,服务器按照所述排序结果和所述搜索条目的内容生成搜索结果;
这里,上述的步骤S207至步骤211分别对应于实施例一中的步骤S122至步骤126,因此,本领域的技术人员可以参阅实施例一而理解上述的步骤S207至步骤S211,为节约篇幅,这里不再赘述。
步骤S212,将所述搜索结果携带于第一响应消息中,发送给所述终端。
这里,上述的步骤S212实际上提供一种实现步骤S127“输出所述搜索结果”的方式。
步骤S213,终端从第一响应消息中获取搜索结果;
步骤S214,终端显示搜索结果;
这里,终端将搜索结果显示在终端的显示屏上;
步骤S215,用户点击查看搜索结果中的某一项搜索条目的内容。
实施例三
本发明实施例提供实现一种计算实施例一和实施例二中搜索条目的相关度的方法,当输出搜索结果后,计算设备还需要记录用户对搜索结果的行为,这种用户对搜索结果的行为可以以反馈信息的形式进行记录,然后根据用户的行为(即反馈)对搜索结果进行闭环调节,其中反馈是借用控制论中的反馈概念,指将系统的输出返回到输入并以某种方式改变输入,进而影响系统功能的过程,在本发明实施例中,控制论中的系统可以是指搜索引擎,搜索引擎的搜索结果即为搜索引擎的输出,关键词即为搜索引擎的输入,需要说明的是,与控制论中闭环控制不同的是,本发明中利用的不是搜索结果,而是用户对搜索结果的响应,同样,改变的不是搜索引擎的输入“关键词”而是搜索条目的相关度。
图3为本发明实施例三计算搜索条目的相关度的实现流程示意图,如图3所示,该方法包括:
步骤S301,用户对搜索结果进行响应。
这里,所述响应可以包括:用户点击查看搜索结果中的某一项搜索条目的内容,也可以是用户只是浏览了搜索结果,而不进行任何的点击操作。
步骤S302,计算设备获取用于表明用户对搜索结果的响应的反馈信息;
这里,所述反馈信息中携带有关键词和响应集合中搜索条目的标识信息,所述响应集合为用户响应搜索结果中的搜索条目的集合;简单来说,响应集合就是在搜索结果中用户点击了的搜索条目,用户所有点击过的搜索条目形成响应集合。其中搜索条目的标识信息可以为搜索条目的编号信息。
这里,举例来说明响应集合,假设针对某一关键词的搜索结果一共有400条搜索条目,其中在搜索结果的第一页面中一共显示了相关度高的前20条搜索条目,其中用户点击了第1、第3、第6和第7条搜索条目,第1、第3、第6和第7条搜索条目组成响应集合,换句话说,响应集合中包括4条搜索条目。对应地,反馈信息中包括关键词和第1、第3、第6和第7条搜索条目的标识信息。
步骤S303,计算设备根据所述响应集合中搜索条目的标识信息对所述搜索结果中对应的搜索条目的总点击量和预设时间段内的点击量进行更新;
这里,继续承接步骤S302中的例子,计算设备根据第1、第3、第6和第7条搜索条目的标识信息对相应的搜索条目的总点击量和预设时间段内的点击量进行更新,举例来说,之前第1、第3、第6和第7条搜索条目的总点击量分为m11、m13、m16和m17次,第1、第3、第6和第7条预设时间段内的点击量分为m21、m23、m26和m27次,其中,m11、m13、m16和m17均为大于等于0的整数,m21、m23、m26和m27均为大于等于0的整数;那么更新后第1、第3、第6和第7条搜索条目的总点击量为(m11+1)、(m13+1)、(m16+1)和(m17+1)次;更新后第1、第3、第6和第7条搜索条目的在预设时间段内的点击量为(m21+1)、(m23+1)、(m26+1)和(m27+1)次。对于搜索结果中其他的(400-4=396)条搜索条目,由于用户并未进行点击,因此,可以不对其他的396条搜索条目的总点击量和预设时间段内的点击量进行更新。
步骤S304,计算设备获取所述函数中第一相关系数和第二相关系数;
步骤S305,计算设备根据第一相关系数、第二相关系数、总点击量和预设时间段内的点击量,计算所述搜索结果中搜索条目的相关度。
这里,所述第一相关系数和第二相关系数为预设的,作为优选的实施例,第一相关系数可以大于第二相关系数,这样,计算的相关度中,在预设时间段内的点击量所占的比重将比较重,如此,能够更准确地跟踪所有用户的行为,从而将用户所关心的视频展示给其他用户。
本发明实施例中,所述响应集合中搜索条目的标识信息为空;所述方法还包括:当所述响应集合中搜索条目的标识信息为空时,发出提示信息,用于提示所述搜索结果出现异常。
这里,当所述响应集合中搜索条目的标识信息为空时,说明搜索结果中没有用户感兴趣的搜索条目,换句话说,目前搜索引擎提供的搜索质量比较差,所以搜索结果中用户点击率为0。当用户的点击量为0时,就需要在人工分析后进行人工干预,人工分析一般是搜索引擎的管理者或者研发人员,人工干预就是把一些排序靠后的结果强制排在靠前的位置。在具体实施的过程中,为了提高本发明的健壮性,可以对标识信息为空的情况进行累计,当累计的次数大于等于预设的阈值的时候,才发出提示信息。例如,当用户以关键词“ffff”搜索电影“ffff”时,计算设备所展示的关于“ffff”的搜索结果,有超过10次(10次为预设的阈值),响应集合中搜索条目的标识信息为空,这时,就发出提示信息。
本发明实施例提供的技术方案可以用于下面的场景:举例来说,最近刚刚杀青一部演员A主演的电影,电影名称叫做“ffff”,由于快要上映了,目前市面上刚刚流放出一个关于该电影的片花。当用户通过与朋友交流得知该部电影后,想抢先看一下电影“ffff”的片花,当用户在搜索框中搜索以“ffff”为关键词搜索该电影时,结果搜索出860条记录,其中不幸的是,95%的是演员B主演的“ffff”,现有技术中,由于相关度的计算没有考虑到预设时间段内的点击量,那么搜索结果中的第1页中的前20条搜索条目中都没有演员A主演的电影“ffff”;而本发明实施例提供的技术方案中考虑到了预设时间段内的点击量,那么搜索结果中的第1页的第3条搜索条目中展示了演员A主演的电影“ffff”。
实施例四
基于前述的实施例三,本发明实施例提供一种信息处理方法,该方法中,以搜索引擎是基于C/S结构为例,图4为本发明实施例四信息处理方法的实现流程示意图,如图4所示,该方法包括:
步骤S401,用户对搜索结果进行响应。
这里,所述响应可以包括:用户点击查看搜索结果中的某一项搜索条目的内容,也可以是用户只是浏览了搜索结果,而不进行任何的点击操作。
步骤S402,终端获取用于表明用户对搜索结果的响应的反馈信息;
这里,所述反馈信息中携带有关键词、响应集合中搜索条目的标识信息和所述响应集合中搜索条目的停留时间,所述响应集合为用户响应搜索结果中的搜索条目的集合。
这里,举例来说明响应集合,假设针对某一关键词的搜索结果一共有400条搜索条目,其中在搜索结果的第一页面中一共显示了相关度高的前20条搜索条目,其中用户点击了第1、第3、第6和第7条搜索条目,第1、第3、第6和第7条搜索条目组成响应集合,换句话说,响应集合中包括4条搜索条目。对应地,反馈信息中包括关键词和第1、第3、第6和第7条搜索条目的标识信息。
这里,下面来说明停留时间,用户在搜索结果中获取自己想要看的视频时,一般会根据视频摘要决定是否要点击,以便打开视频,当用户觉得视频摘要与自己的期望比较相近时,用户就会打开视频。打开视频后,进一步确定打开的视频是不是自己想要看的视频,当打开的视频是用户想要看的视频时,用户就会停留在该视频上,对该视频进行下一步的操作,例如下载视频或者持续观看视频;当打开的视频不是用户想要看的视频时,用户就关闭该视频;然后返回到搜索结果中,继续查看下一条搜索条目是不是自己想要的视频。从用户打开搜索条目对应的视频到关闭该视频所持续的时间段,即为停留时间。
步骤S403,终端将所述反馈信息发送给服务器;
步骤S404,服务器根据所述响应集合中搜索条目的标识信息对所述搜索结果中对应的搜索条目的总点击量和预设时间段内的点击量进行更新;
这里,继续承接上面的例子,计算设备根据第1、第3、第6和第7条搜索条目的标识信息对相应的搜索条目的总点击量和预设时间段内的点击量进行更新,举例来说,之前第1、第3、第6和第7条搜索条目的总点击量分为m11、m13、m16和m17次,第1、第3、第6和第7条预设时间段内的点击量分为m21、m23、m26和m27次,其中,m11、m13、m16和m17均为大于等于0的整数,m21、m23、m26和m27均为大于等于0的整数;那么更新后第1、第3、第6和第7条搜索条目的总点击量为(m11+1)、(m13+1)、(m16+1)和(m17+1)次;更新后第1、第3、第6和第7条搜索条目的在预设时间段内的点击量为(m21+1)、(m23+1)、(m26+1)和(m27+1)次。对于搜索结果中其他的(400-4=396)条搜索条目,由于用户并未进行点击,因此,可以不对其他的396条搜索条目的总点击量和预设时间段内的点击量进行更新。
步骤S405,服务器按照所述停留时间从长到短的顺序成正比例地对相应的第二相关系数进行调整,得到第三相关系数,所述第三相关系数大于第二相关系数;
这里,继续承接上面的例子,假设用户在第1、第3、第6和第7条搜索条目对应的视频上停留时间分为t1、t3、t6和t7,其中,t7大于(>)t3>t1=t6,那么,在对第3、第6和第7条搜索条目的第二相关系数进行调整时,假设第1、第3、第6和第7条搜索条目的第二相关系数分别为a21、a23、a26和a27,调整之后的第1、第3、第6和第7条搜索条目的第三相关系数分别为a31、a33、a36和a37,那么第7条搜索条目的第三相关系数a37比其他的搜索条目的第三相关系数都高,而第1和第6条搜索条目的第三相关系数a31、a36相同,而且第1和第6条搜索条目的第三相关系数小于第3条搜索条目的第三相关系数a33。
步骤S406,服务器获取搜索条目的第一相关系数和第三相关系数或第二相关系数;
步骤S407,服务器根据第一相关系数、第三相关系数或第二相关系数、总点击量和预设时间段内的点击量,计算所述搜索结果中搜索条目的相关度。
这里,当搜索条目不是响应集合中时,该搜索条目具有第二相关系数;当当搜索条目是响应集合中时,该搜索条目具有第三相关系数,因此,在计算搜索条目的相关度时,有些搜索条目是采用第二相关系数,有些搜索条目是采用第三相关系数的。
本发明实施例中,所述方法还包括:将所述停留时间满足预设的第一条件的搜索条目的第二相关系数进行调整,得到第四相关系数,所述第四相关系数大于第二相关系数。
这里,所述第一条件可以为预设的时间阈值,时间阈值可以为某一固定数值,例如时间阈值可以30秒(s)或者1分钟;时间阈值还可以一动态数值,例如,时间阈值为视频总时长的80%。当用户在视频上停留的时间超过视频总时长的80%时,说明用户有效地观看了该视频,并且认为该视频是用户期望的视频,否则用户将不可能浪费这么多的时间在该视频上。
这里,所述第四相关系数与第三相关系数类似,这里不再赘述。当第二相关系数调整为第四相关系数时,对应地,所述步骤S406为,服务器获取搜索条目的第一相关系数和第四相关系数或第二相关系数;对应地,步骤S407,服务器根据第一相关系数、第四相关系数或第二相关系数、总点击量和预设时间段内的点击量,计算所述搜索结果中搜索条目的相关度。
实施例五
基于前述的实施例三,本发明实施例提供一种信息处理方法,该方法中,以搜索引擎是基于C/S结构为例,图5为本发明实施例五信息处理方法的实现流程示意图,如图5所示,该方法包括:
步骤S401,用户对搜索结果进行响应。
这里,所述响应可以包括:用户点击查看搜索结果中的某一项搜索条目的内容,也可以是用户只是浏览了搜索结果,而不进行任何的点击操作。
步骤S402,终端获取用于表明用户对搜索结果的响应的反馈信息;
步骤S403,终端将所述反馈信息发送给服务器;
步骤S404,服务器根据所述响应集合中搜索条目的标识信息对所述搜索结果中对应的搜索条目的总点击量和预设时间段内的点击量进行更新;
这里,上述的步骤S401至步骤S404分别对应于实施例四中的步骤S401至步骤S404,因此,本领域的技术人员可以参阅实施例四而理解实施例五中的步骤S401至步骤S404,为节约篇幅,这里不再赘述。
步骤S501,服务器获取所述函数中第一相关系数和第二相关系数;
步骤S502,服务器根据第一相关系数、第二相关系数、总点击量和预设时间段内的点击量,计算所述搜索结果中搜索条目的相关度;
步骤S503,服务器将所述停留时间满足预设的第一条件的搜索条目作为第一搜索条目;
这里,所述第一条件可以为预设的时间阈值,时间阈值可以为某一固定数值,例如时间阈值可以30秒(s)或者1分钟;时间阈值还可以一动态数值,例如,时间阈值为视频总时长的80%。当用户在视频上停留的时间超过视频总时长的80%时,说明用户有效地观看了该视频,并且认为该视频是用户期望的视频,否则用户将不可能浪费这么多的时间在该视频上。
步骤S504,服务器根据所述第一搜索条目的标识信息获取对应的第一视频显示信息和第一视频页面,所述第一视频显示信息展示在所述第一视频页面上;
这里,获取到第一视频显示信息和第一视频页面后,确定第一视频显示信息在所述第一视频页面的位置信息;
步骤S505,服务器根据所述停留时间对所述第一视频显示信息在所述第一视频页面的位置进行调整,得到第二视频页面;
这里,假设第一视频显示信息的位置采用第一参数来描述,所述第一参数用于描述第一视频显示信息的位置的好坏,在具体实施的过程,所述第一参数可以采用排列的先后顺序,或者,排列的区域,例如,在视频网站上,一般点击量比较高或者评价比较好的或者最近热播的电影都是排列的比较靠前,这样,方便用户在登录视频网站之后,方便地找到用户想看的电影。对应地,在步骤S505中,对第一视频页面的位置进行调整可以是对第一参数进行的调整。
这里,步骤S505中,可以将停留时间从长到短的顺序对第一参数进行调整,停留时间越长的,位置的调整的越好,如果第一参数为排列的先后顺序时,那么就是将停留时间长的搜索条目的位置排列在最靠前的位置。
步骤S506,服务器输出所述第二视频页面。
实施例六
基于前述的实施例,本发明实施例提供信息处理方法,该方法实际上一种基于用户点击的搜索条目自动进行排序的方法,该方法主要可以分为三个部分:
(1)上报用户行为
对用户的每一组关键词(query),上报用户对搜索结果的每一次操作(用户的响应),即实施例三中的反馈信息。上报内容主要涉及搜索的关键词、点击的搜索条目的序号等等,其中点击的搜索条目即响应集合中搜索条目,点击的搜索条目的序号即响应集合中搜索条目的标识信息。比如用户搜索了某个词语,在搜索结果中,点击了搜索结果中的第二条搜索条目,这时要把用户的这种响应行为进行上报。
(2)对上报内容进行分析
每隔一定的时间,对用户在某段时间的行为上报进行分析,主要分析内容包括搜索的热词,其中热词即用户在这段时间内搜索次数最多的词。主要分析内容同时还包括用户只进行搜索,不做任何点击的出现频率较高的关键词,即那些点击量为0的关键词,说明目前搜索引擎所提供的搜索质量比较低,因此后续需要人工进行结果查看分析。
(3)自动化人工干预
对于(2)中数据分析的结果,每隔一段时间自动化实施干预。为了避免自动化干预和人工干预的冲突,干预结果可以以人工干预为主,在创建人工干预项的时候需要支持指定该项是否能够被自动化干预使用,如果可以,则允许自动化干预修改人工干预项,否则不允许。
干预的主要对象是:用户点击结果普遍靠后的搜索关键词。比如某关键词,30%的用户点击的是第一页的第2个搜索条目,50%的用户点击的是第二页的第4个搜索条目,只有20%的用户点击第一页的第1个搜索条目,那么需要自动化地设置干预项,将第二页的第4个搜索条目干预到第一页第1个,将原来第一页的第2个搜索条目保持目前的位置,将原来第一页的第1个搜索条目干预到第一页第3个。干预时,优先修改之前已经建立的干预项,即该关键词之前已经干预过,但是用户行为发生了改变,则修改该干预项即可,否则会造成冲突;如果之前没有干预过,则新建干预项进行干预。对用户点击率为0的关键词,需要在人工分析后进行人工干预。
本发明上述各实施例提供的技术方案能够产生如下的有益效果,本发明提供的技术方案可以对用户的搜索点击行为做较为实时的响应,并且能够较为准确的分析和回应用户的真正搜索意图,提高搜索结果的质量。同时,还可以减轻原有人工干预系统中人的负担。
实施例七
基于前述的方法实施例,本发明实施例提供一种信息处理装置,该装置中的第一获取单元、搜索单元、第二获取单元、排序单元、第三获取单元、生成单元和输出单元,都可以通过计算设备中的处理器来实现;当然也可通过具体的逻辑电路实现;在具体实施例的过程中,处理器可以为中央处理器(CPU)、微处理器(MPU)、数字信号处理器(DSP)或现场可编程门阵列(FPGA)等。
图6为本发明实施例七信息处理装置的组成结构示意图,如图6所示,该信息处理装置600包括第一获取单元601、搜索单元602、第二获取单元603、排序单元604、第三获取单元605、生成单元606和输出单元607,其中:
所述第一获取单元601,用于获取待搜索的关键词,所述关键词为用户通过搜索引擎进行搜索视频的视频属性信息;
所述搜索单元602,用于根据所述关键词在索引数据库中搜索,得到搜索条目;
所述第二获取单元603,用于获取所述搜索条目的相关度,所述相关度是关于总点击量和预设时间段内的点击量的函数;
所述排序单元604,用于按照相关度从大到小的顺序对所述搜索条目排序,得到排序结果;
所述第三获取单元605,用于获取搜索条目的内容,所述搜索条目的内容包括视频的链接地址和视频摘要;
所述生成单元606,用于按照所述排序结果和所述搜索条目的内容生成搜索结果;
所述输出单元607,用于输出所述搜索结果。
本发明实施例中,在所述函数中,第一相关系数大于等于第二相关系数,其中所述第一相关系数为所述预设时间段内的点击量的相关系数,所述第二相关系数为所述总点击量的相关系数。
这里需要指出的是:以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果,因此不做赘述。对于本发明装置实施例中未披露的技术细节,请参照本发明方法实施例的描述而理解,为节约篇幅,因此不再赘述。
实施例八
基于前述的方法实施例,本发明实施例提供一种信息处理装置,该装置中的第一获取单元、搜索单元、第二获取单元、排序单元、第三获取单元、生成单元和输出单元,以及第一获取单元所包括的第一接收模块和解析模块,都可以通过计算设备中的处理器来实现;当然也可通过具体的逻辑电路实现;在具体实施例的过程中,处理器可以为中央处理器、微处理器、数字信号处理器或现场可编程门阵列等。
图7为本发明实施例八信息处理装置的组成结构示意图,如图7所示,该装置600包括第一获取单元601、搜索单元602、第二获取单元603、排序单元604、第三获取单元605、生成单元606和输出单元607,其中所述第一获取单元601包括第一接收模块6011和解析模块6012,其中:
所述第一接收模块6011,用于接收终端发送的第一请求消息,所述第一请求消息中携带有待搜索的关键词;
所述解析模块6012,用于解析所述第一请求消息,得到所述关键词;
所述搜索单元602,用于根据所述关键词在索引数据库中搜索,得到搜索条目;
所述第二获取单元603,用于获取所述搜索条目的相关度,所述相关度是关于总点击量和预设时间段内的点击量的函数;
所述排序单元604,用于按照相关度从大到小的顺序对所述搜索条目排序,得到排序结果;
所述第三获取单元605,用于获取搜索条目的内容,所述搜索条目的内容包括视频的链接地址和视频摘要;
所述生成单元606,用于按照所述排序结果和所述搜索条目的内容生成搜索结果;
所述输出单元607,用于将所述搜索结果携带于第一响应消息中,发送给所述终端。
这里需要指出的是:以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果,因此不做赘述。对于本发明装置实施例中未披露的技术细节,请参照本发明方法实施例的描述而理解,为节约篇幅,因此不再赘述。
实施例九
基于前述的方法实施例,本发明实施例提供一种计算实施例七和实施例八中的搜索条目的相关度的装置,该装置中的第四获取单元、更新单元、第五获取单元和计算单元等单元,都可以通过计算设备中的处理器来实现;当然也可通过具体的逻辑电路实现;在具体实施例的过程中,处理器可以为中央处理器、微处理器、数字信号处理器或现场可编程门阵列等。
图8为本发明实施例九计算搜索条目的相关度的装置的组成结构示意图,如图8所示,该计算搜索条目的相关度的装置800包括第四获取单元801、更新单元802、第五获取单元803和计算单元804,其中:
所述第四获取单元801,用于获取用于表明用户对搜索结果的响应的反馈信息,所述反馈信息中携带有关键词和响应集合中搜索条目的标识信息,所述响应集合为用户响应搜索结果中的搜索条目的集合;
所述更新单元802,用于根据所述响应集合中搜索条目的标识信息对所述搜索结果中对应的搜索条目的总点击量和预设时间段内的点击量进行更新;
所述第五获取单元803,用于获取所述函数中第一相关系数和第二相关系数;
所述计算单元804,用于根据第一相关系数、第二相关系数、总点击量和预设时间段内的点击量,计算所述搜索结果中搜索条目的相关度。
本发明实施例中,其中所述响应集合中搜索条目的标识信息为空;所述装置还包括提示单元,用于当所述响应集合中搜索条目的标识信息为空时,发出提示信息,用于提示所述搜索结果出现异常。
本发明实施例中,所述反馈信息中还携带有所述响应集合中搜索条目的停留时间;所述装置还包括:第一调整单元,用于按照所述停留时间从长到短的顺序成正比例地对相应的第二相关系数进行调整,得到第三相关系数,所述第三相关系数大于第二相关系数。
本发明实施例中,所述装置还包括第二调整单元,用于将所述停留时间满足预设的第一条件的搜索条目的第二相关系数进行调整,得到第四相关系数,所述第四相关系数大于第二相关系数。
本发明实施例中,所述装置还包括第六获取单元、第三调整单元和第二输出单元,其中:
所述第六获取单元,用于将所述停留时间满足预设的第一条件的搜索条目作为第一搜索条目;根据所述第一搜索条目的标识信息获取对应的第一视频显示信息和第一视频页面,所述第一视频显示信息展示在所述第一视频页面上;
所述第三调整单元,用于根据所述停留时间对所述第一视频显示信息在所述第一视频页面的位置进行调整,得到第二视频页面;
所述第二输出单元,用于输出所述第二视频页面。
这里需要指出的是:以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果,因此不做赘述。对于本发明装置实施例中未披露的技术细节,请参照本发明方法实施例的描述而理解,为节约篇幅,因此不再赘述。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (16)

1.一种信息处理方法,其特征在于,所述方法包括:
获取待搜索的关键词,所述关键词为用户通过搜索引擎进行搜索视频的视频属性信息;
根据所述关键词在索引数据库中搜索,得到至少两个搜索条目;
获取用于计算所述搜索条目的相关度的函数、所述函数中的第一相关系数和所述函数中的第二相关系数;所述第一相关系数大于或等于所述第二相关系数,其中所述第一相关系数为预设时间段内的点击量的相关系数,所述第二相关系数为总点击量的相关系数;
根据所述第一相关系数、所述第二相关系数、所述总点击量和所述预设时间段内的点击量,确定每一所述搜索条目的相关度;
按照所述相关度从大到小的顺序对所述至少两个搜索条目排序,得到排序结果;
获取每一搜索条目的内容,所述搜索条目的内容包括视频的链接地址和视频摘要;
将每一所述搜索条目中的视频的链接地址嵌入到对应视频摘要中;
按照所述排序结果,通过嵌入有所述链接地址的视频摘要生成页面;
将所述页面作为搜索结果输出。
2.根据权利要求1所述的方法,其特征在于,所述获取待搜索的关键词,包括:
接收终端发送的第一请求消息,所述第一请求消息中携带有待搜索的关键词;
解析所述第一请求消息,得到所述关键词;
对应地,所述将所述搜索结果输出,包括:
将所述搜索结果携带于第一响应消息中,发送给所述终端。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取用于表明用户对搜索结果的响应的反馈信息,所述反馈信息中携带有关键词和响应集合中搜索条目的标识信息,所述响应集合为用户响应搜索结果中的搜索条目的集合;
根据所述响应集合中搜索条目的标识信息对所述搜索结果中对应的搜索条目的总点击量和预设时间段内的点击量进行更新。
4.根据权利要求3所述的方法,其特征在于,其中所述响应集合中搜索条目的标识信息为空;所述方法还包括:
当所述响应集合中搜索条目的标识信息为空时,发出提示信息,用于提示所述搜索结果出现异常。
5.根据权利要求3所述的方法,其特征在于,所述反馈信息中还携带有所述响应集合中搜索条目的停留时间;所述方法还包括:
按照所述停留时间从长到短的顺序成正比例地对相应的第二相关系数进行调整,得到第三相关系数,所述第三相关系数大于第二相关系数。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
将所述停留时间满足预设的第一条件的搜索条目的第二相关系数进行调整,得到第四相关系数,所述第四相关系数大于第二相关系数。
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:
将所述停留时间满足预设的第一条件的搜索条目作为第一搜索条目;
根据所述第一搜索条目的标识信息获取对应的第一视频显示信息和第一视频页面,所述第一视频显示信息展示在所述第一视频页面上;
根据所述停留时间对所述第一视频显示信息在所述第一视频页面的位置进行调整,得到第二视频页面;
将所述第二视频页面输出。
8.一种信息处理方法,其特征在于,所述方法还包括:
获取用于表明用户对搜索结果的响应的反馈信息,所述反馈信息中携带有关键词和响应集合中搜索条目的标识信息,所述响应集合为用户响应搜索结果中的搜索条目的集合;
根据所述响应集合中搜索条目的标识信息对所述搜索结果中对应的搜索条目的总点击量和预设时间段内的点击量进行更新;
获取用于计算所述搜索条目的相关度的函数、所述函数中的第一相关系数和所述函数中的第二相关系数;所述第一相关系数大于或等于所述第二相关系数,其中所述第一相关系数为预设时间段内的点击量的相关系数,所述第二相关系数为总点击量的相关系数;
根据所述第一相关系数、所述第二相关系数、所述总点击量和所述预设时间段内的点击量,计算所述搜索结果中搜索条目的相关度。
9.一种信息处理装置,其特征在于,所述装置包括第一获取单元、搜索单元、第二获取单元、第一计算单元、排序单元、第三获取单元、生成单元和输出单元,其中:
所述第一获取单元,用于获取待搜索的关键词,所述关键词为用户通过搜索引擎进行搜索视频的视频属性信息;
所述搜索单元,用于根据所述关键词在索引数据库中搜索,得到至少两个搜索条目;
所述第二获取单元,用于获取用于计算所述搜索条目的相关度的函数、所述函数中的第一相关系数和所述函数中的第二相关系数;所述第一相关系数大于或等于所述第二相关系数,其中所述第一相关系数为预设时间段内的点击量的相关系数,所述第二相关系数为总点击量的相关系数;
所述第一计算单元,用于根据所述第一相关系数、所述第二相关系数、所述总点击量和所述预设时间段内的点击量,确定每一所述搜索条目的相关度;
所述排序单元,用于按照所述相关度从大到小的顺序对所述至少两个搜索条目排序,得到排序结果;
所述第三获取单元,用于获取每一搜索条目的内容,所述搜索条目的内容包括视频的链接地址和视频摘要;
所述生成单元,用于将每一所述搜索条目中的视频的链接地址嵌入到对应视频摘要中;按照所述排序结果,通过嵌入有所述链接地址的视频摘要生成页面;
所述输出单元,用于将所述页面作为搜索结果输出。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括第四获取单元、更新单元、第五获取单元和计算单元,其中:
所述第四获取单元,用于获取用于表明用户对搜索结果的响应的反馈信息,所述反馈信息中携带有关键词和响应集合中搜索条目的标识信息,所述响应集合为用户响应搜索结果中的搜索条目的集合;
所述更新单元,用于根据所述响应集合中搜索条目的标识信息对所述搜索结果中对应的搜索条目的总点击量和预设时间段内的点击量进行更新。
11.根据权利要求10所述的装置,其特征在于,其中所述响应集合中搜索条目的标识信息为空;所述装置还包括提示单元,用于当所述响应集合中搜索条目的标识信息为空时,发出提示信息,用于提示所述搜索结果出现异常。
12.根据权利要求10所述的装置,其特征在于,所述反馈信息中还携带有所述响应集合中搜索条目的停留时间;所述装置还包括:第一调整单元,用于按照所述停留时间从长到短的顺序成正比例地对相应的第二相关系数进行调整,得到第三相关系数,所述第三相关系数大于第二相关系数。
13.根据权利要求12所述的装置,其特征在于,所述装置还包括第二调整单元,用于将所述停留时间满足预设的第一条件的搜索条目的第二相关系数进行调整,得到第四相关系数,所述第四相关系数大于第二相关系数。
14.根据权利要求12所述的装置,其特征在于,所述装置还包括第六获取单元、第三调整单元和第二输出单元,其中:
所述第六获取单元,用于将所述停留时间满足预设的第一条件的搜索条目作为第一搜索条目;根据所述第一搜索条目的标识信息获取对应的第一视频显示信息和第一视频页面,所述第一视频显示信息展示在所述第一视频页面上;
所述第三调整单元,用于根据所述停留时间对所述第一视频显示信息在所述第一视频页面的位置进行调整,得到第二视频页面;
所述第二输出单元,用于输出所述第二视频页面。
15.一种信息处理装置,其特征在于,所述装置还包括第四获取单元、更新单元、第五获取单元和第二计算单元,其中:
所述第四获取单元,用于获取用于表明用户对搜索结果的响应的反馈信息,所述反馈信息中携带有关键词和响应集合中搜索条目的标识信息,所述响应集合为用户响应搜索结果中的搜索条目的集合;
所述更新单元,用于根据所述响应集合中搜索条目的标识信息对所述搜索结果中对应的搜索条目的总点击量和预设时间段内的点击量进行更新;
所述第五获取单元,用于获取用于计算所述搜索条目的相关度的函数、所述函数中的第一相关系数和所述函数中的第二相关系数;所述第一相关系数大于或等于所述第二相关系数,其中所述第一相关系数为预设时间段内的点击量的相关系数,所述第二相关系数为总点击量的相关系数;
所述第二计算单元,用于根据所述第一相关系数、所述第二相关系数、所述总点击量和所述预设时间段内的点击量,计算所述搜索结果中搜索条目的相关度。
16.一种存储介质,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令配置为执行上述权利要求1至7任一项,或者,权利要求8所提供的信息处理方法。
CN201510401747.2A 2015-07-09 2015-07-09 一种信息处理方法及装置 Active CN106339394B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510401747.2A CN106339394B (zh) 2015-07-09 2015-07-09 一种信息处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510401747.2A CN106339394B (zh) 2015-07-09 2015-07-09 一种信息处理方法及装置

Publications (2)

Publication Number Publication Date
CN106339394A CN106339394A (zh) 2017-01-18
CN106339394B true CN106339394B (zh) 2020-09-11

Family

ID=57827247

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510401747.2A Active CN106339394B (zh) 2015-07-09 2015-07-09 一种信息处理方法及装置

Country Status (1)

Country Link
CN (1) CN106339394B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106682240A (zh) * 2017-02-07 2017-05-17 百度在线网络技术(北京)有限公司 用于推送信息的方法、装置、电子设备和存储介质
CN108733686A (zh) * 2017-04-17 2018-11-02 伊姆西Ip控股有限责任公司 信息处理方法和设备
CN109766457B (zh) * 2017-11-09 2022-12-23 腾讯科技(深圳)有限公司 一种媒体内容搜索方法、装置及存储介质
CN108280155B (zh) * 2018-01-11 2022-04-08 百度在线网络技术(北京)有限公司 基于短视频的问题检索反馈方法、装置及其设备
CN109145246A (zh) * 2018-07-31 2019-01-04 成都华栖云科技有限公司 一种基于paas媒体云多租户平台的新闻虚拟点击量实现方法
CN109492089A (zh) * 2018-10-18 2019-03-19 上海连尚网络科技有限公司 用于输出信息的方法和装置
CN111581544A (zh) * 2019-04-08 2020-08-25 众巢医学科技(上海)股份有限公司 搜索结果优化方法、装置、计算机设备及存储介质
CN111078986B (zh) * 2019-12-13 2023-10-20 腾讯科技(深圳)有限公司 数据检索方法、装置及计算机可读存储介质
CN111694984B (zh) * 2020-06-12 2023-06-20 百度在线网络技术(北京)有限公司 视频搜索方法、装置、电子设备及可读存储介质
CN112148923B (zh) * 2020-08-18 2023-12-26 北京达佳互联信息技术有限公司 搜索结果的排序方法、排序模型的生成方法、装置及设备
CN112802569B (zh) * 2021-02-05 2023-08-08 北京嘉和海森健康科技有限公司 一种语义信息的获取方法、装置、设备及可读存储介质
CN112989076A (zh) * 2021-04-15 2021-06-18 北京字节跳动网络技术有限公司 多媒体内容搜索方法、装置、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103500233A (zh) * 2013-10-25 2014-01-08 乐视网信息技术(北京)股份有限公司 一种多媒体文件推荐方法及装置
CN103500235A (zh) * 2013-10-25 2014-01-08 乐视网信息技术(北京)股份有限公司 一种多媒体文件推荐方法及装置
CN104778233A (zh) * 2015-03-31 2015-07-15 北京奇虎科技有限公司 一种基于点击量的搜索方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103500233A (zh) * 2013-10-25 2014-01-08 乐视网信息技术(北京)股份有限公司 一种多媒体文件推荐方法及装置
CN103500235A (zh) * 2013-10-25 2014-01-08 乐视网信息技术(北京)股份有限公司 一种多媒体文件推荐方法及装置
CN104778233A (zh) * 2015-03-31 2015-07-15 北京奇虎科技有限公司 一种基于点击量的搜索方法和装置

Also Published As

Publication number Publication date
CN106339394A (zh) 2017-01-18

Similar Documents

Publication Publication Date Title
CN106339394B (zh) 一种信息处理方法及装置
CN108881339B (zh) 推送方法、用户标签的生成方法、装置及设备
US8751511B2 (en) Ranking of search results based on microblog data
CN102667761B (zh) 可扩展的集群数据库
US9355185B2 (en) Infinite browse
US8645367B1 (en) Predicting data for document attributes based on aggregated data for repeated URL patterns
US8656264B2 (en) Dynamic aggregation and display of contextually relevant content
US7761423B1 (en) System and method for indexing a network of interrelated elements
JP5166949B2 (ja) レコメンド情報生成装置およびレコメンド情報生成方法
US8312004B2 (en) Online ranking protocol
CN107766399B (zh) 用于使图像与内容项目匹配的方法和系统及机器可读介质
CN105701216A (zh) 一种信息推送方法及装置
EP2583190A1 (en) Determining and using search term weightings
CN103324645A (zh) 一种网页推荐方法和装置
WO2008133368A1 (en) Information search ranking system and method based on users' attention levels
WO2009031759A1 (en) Method and system for generating search collection of query
EP1732019A1 (en) Method and device for searching a data unit in a database
CN110659414B (zh) 一种基于用户画像的个性化信息推送方法及用户端
CN106682049B (zh) 议题显示系统和议题显示方法
US20170287041A1 (en) Information processing apparatus, information processing method, and information processing program
CN106777143A (zh) 一种新闻聚合方法及新闻聚合服务器
US8312011B2 (en) System and method for automatic detection of needy queries
CN111782919A (zh) 在线文档的处理方法、装置、计算机设备及存储介质
JP2010181966A (ja) レコメンド情報評価装置およびレコメンド情報評価方法
WO2015000083A1 (en) System and method for ranking online content

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant