CN110245289A - 一种信息搜索方法以及相关设备 - Google Patents

一种信息搜索方法以及相关设备 Download PDF

Info

Publication number
CN110245289A
CN110245289A CN201910420836.XA CN201910420836A CN110245289A CN 110245289 A CN110245289 A CN 110245289A CN 201910420836 A CN201910420836 A CN 201910420836A CN 110245289 A CN110245289 A CN 110245289A
Authority
CN
China
Prior art keywords
user
search result
search
information
relating value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910420836.XA
Other languages
English (en)
Inventor
李锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Property and Casualty Insurance Company of China Ltd
Original Assignee
Ping An Property and Casualty Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Property and Casualty Insurance Company of China Ltd filed Critical Ping An Property and Casualty Insurance Company of China Ltd
Priority to CN201910420836.XA priority Critical patent/CN110245289A/zh
Publication of CN110245289A publication Critical patent/CN110245289A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种信息搜索方法、装置、电子设备和存储介质,所述方法包括:接收来自客户端的搜索关键字以及用户标识;根据搜索关键字进行搜索,获得多个搜索结果;获取用户标识对应的用户画像信息;获取多个搜索结果中各个搜索结果与用户的属性标签的各个第一关联值,以及获取多个搜索结果中各个搜索结果与用户的兴趣标签的各个第二关联值;根据各个第一关联值的大小以及各个第二关联值的大小对多个搜索结果进行排序,得到搜索结果的排序列表;将搜索结果的排序列表发送给所述客户端。通过本申请的信息搜索方法得到搜索结果与用户的需求更加贴切,大大节约了用户花费在筛选信息的时间。

Description

一种信息搜索方法以及相关设备
技术领域
本申请涉及计算机技术领域,尤其涉及一种信息搜索方法、装置、电子设备以及计算机可读存储介质。
背景技术
随着信息技术的发展和普及,多样化的信息资源充斥了整个互联网。为了从不计其数的信息资源中找到需要的信息,用户可以通过关键字搜索的方式寻找与该关键字相关的信息。然而由于每个信息的重要程度不一,且用户对信息的判别能力有限,导致用户在搜索过程中还需要花费大量时间用于筛选所需要的信息。
目前实现搜索的具体方法为:搜索与用户输入的某个关键字相关的信息,得到与该关键字对应的多个信息后,根据搜索到的各个信息与关键字的关联性,对搜索到的各个信息进行排序,与该关键字关联性大的信息排列在前,与该关键字关联性小的信息排列在后。
在上述搜索的过程中,针对用户输入的某个关键字获取与该关键字相关的搜索结果,不同的用户还需要根据各自的需求在与该关键字相关的搜索结果中进行进一步地查阅,才能得到需要的信息,因此上述搜索方式在实现上,不够快捷,且不具针对性。
发明内容
本申请提出一种信息搜索技术方案,通过实施本申请技术方案可以为每一用户实现定制化的信息搜索,加快了用户信息搜索的速度。
根据本申请第一方面,提供一种信息搜索方法,该方法包括:接收来自客户端的搜索关键字以及用户标识;根据所述搜索关键字进行搜索,获得多个搜索结果;获取所述用户标识对应的用户画像信息,所述用户画像信息包括所述用户的属性标签以及所述用户的兴趣标签;获取所述多个搜索结果中各个搜索结果与所述用户的属性标签的各个第一关联值,以及获取所述多个搜索结果中各个搜索结果与所述用户的兴趣标签的各个第二关联值;根据所述各个第一关联值的大小以及所述各个第二关联值的大小对所述多个搜索结果进行排序,得到所述搜索结果的排序列表;将所述搜索结果的排序列表发送给所述客户端。
在一些实施例中,所述获取所述多个搜索结果中各个搜索结果与所述用户的属性标签的各个第一关联值,以及获取所述多个搜索结果中各个搜索结果与所述用户的兴趣标签的各个第二关联值,包括:根据所述各个搜索结果中出现与所述用户的属性标签相同或同义的关键字词的频次,获得所述各个搜索结果的各个第一关联值;根据所述各个搜索结果中出现与所述用户的兴趣标签相同或同义的关键字词的频次,获得所述各个搜索结果的各个第二关联值。
在一些实施例中,所述根据所述各个第一关联值的大小以及所述各个第二关联值的大小对所述多个搜索结果进行排序,得到所述搜索结果的排序列表,包括:将所述各个第一关联值的大小和所述属性标签的排序权重的乘积,与所述各个第二关联值的大小和所述兴趣标签的排序权重的乘积进行求和,得到所述各个搜索结果对应的排序值;根据所述各个搜索结果对应的排序值的大小对所述各个搜索结果进行排序,得到所述搜索结果的排序列表。
在一些实施例中,在所述接收来自客户端的搜索关键字以及用户标识之前,所述方法还包括:获取所述用户的历史搜索信息;统计所述历史搜索信息中出现频次最高的一个或多个关键字词;根据所述一个或多个关键字词,在用户兴趣标签库中匹配一个或多个与所述关键字词相同或同义的所述兴趣标签。
在一些实施例中,在所述接收来自客户端的搜索关键字以及用户标识之前,所述方法还包括:若所述用户的历史搜索信息的信息量少于预设阈值,为所述用户匹配与所述用户的属性标签相同的其他用户;将所述其他用户中出现频次最高的一个或多个兴趣标签,作为所述用户的一个或多个兴趣标签。
在一些实施例中,所述用户的属性标签是根据所述用户的注册信息得到的,所述用户的兴趣标签是通过统计所述用户的历史浏览记录、所述用户的历史收藏记录、所述用户的历史下载记录、所述用户的历史评论记录和所述用户的历史消费记录中出现频次最高的一个或多个关键字词得到的。
根据本申请第二方面,提供一种信息搜索装置,该装置包括:接收单元,搜索单元,获取单元,排序单元,发送单元,
所述接收单元用于,接收来自客户端的搜索关键字以及用户标识;
所述搜索单元用于,根据所述搜索关键字进行搜索,获得多个搜索结果;
所述获取单元用于,获取所述用户标识对应的用户画像信息,所述用户画像信息包括所述用户的属性标签以及所述用户的兴趣标签;
所述获取单元还用于,获取所述多个搜索结果中各个搜索结果与所述用户的属性标签的各个第一关联值,以及获取所述多个搜索结果中各个搜索结果与所述用户的兴趣标签的各个第二关联值;
所述排序单元用于,根据所述各个第一关联值的大小以及所述各个第二关联值的大小对所述多个搜索结果进行排序,得到所述搜索结果的排序列表;
所述发送单元用于,将所述搜索结果的排序列表发送给所述客户端。
在一些实施例中,所述获取单元具体用于,根据所述各个搜索结果中出现与所述用户的属性标签相同或同义的关键字词的频次,获得所述各个搜索结果的各个第一关联值;根据所述各个搜索结果中出现与所述用户的兴趣标签相同或同义的关键字词的频次,获得所述各个搜索结果的各个第二关联值。
在一些实施例中,所述排序单元具体用于,将所述各个第一关联值的大小和所述属性标签的排序权重的乘积,与所述各个第二关联值的大小和所述兴趣标签的排序权重的乘积进行求和,得到所述各个搜索结果对应的排序值;根据所述各个搜索结果对应的排序值的大小对所述各个搜索结果进行排序,得到所述搜索结果的排序列表。
在一些实施例中,所述装置还包括:统计单元,匹配单元,在所述接收来自客户端的搜索关键字以及用户标识之前,
所述获取单元还用于,获取所述用户的历史搜索信息;
所述统计单元用于,统计所述历史搜索信息中出现频次最高的一个或多个关键字词;
所述匹配单元用于,根据所述一个或多个关键字词,在用户兴趣标签库中匹配一个或多个与所述关键字词相同或同义的所述兴趣标签。
在一些实施例中,所述匹配单元还用于,在所述接收来自客户端的搜索关键字以及用户标识之前,若所述用户的历史搜索信息的信息量少于预设阈值,为所述用户匹配与所述用户的属性标签相同的其他用户;将所述其他用户中出现频次最高的一个或多个兴趣标签,作为所述用户的一个或多个兴趣标签。
在一些实施例中,所述用户的属性标签是根据所述用户的注册信息得到的,所述用户的兴趣标签是通过统计所述用户的历史浏览记录、所述用户的历史收藏记录、所述用户的历史下载记录、所述用户的历史评论记录和所述用户的历史消费记录中出现频次最高的一个或多个关键字词得到的。
根据本申请第三方面,提供一种电子设备,包括:处理器;用于存储计算机可读指令的存储器;其中,所述处理器用于调用所述存储器存储的计算机可读指令,以执行上述第一方面所述的信息搜索方法或其任意可能的实现方式。
根据本申请的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述信息搜索方法或其任意可能的实现方式。
在本申请实施例中,首先,根据搜索关键字进行搜索得到多个搜索结果,然后,获取用户标识对应的用户画像信息,接着,基于各个搜索结果的信息内容与用户画像信息的关联程度,对多个搜索结果进行重新排序,使得与用户画像信息关联较强的用户画像信息排序在前,与用户画像信息关联较弱的用户画像信息排序在后。通过使用用户画像信息对搜索结果进行重新排序,使得重新排序后的搜索结果与用户的需求更加贴切,从而节约了用户花费在筛选信息的时间。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的实施环境示意图;
图2是本申请实施例提供的一种信息搜索方法示意流程图;
图3是本申请实施例提供的一种信息搜索装置的结构示意图;
图4是本申请实施例提供的另一种信息搜索装置的结构示意图;
图5是本申请实施例提供的电子设备结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
为了便于下文的理解,首先对本申请是实施例涉及的实施环境进行简单描述,具体参见图1,用户通过安装有信息搜索客户端的终端设备发起搜索请求,该搜索请求经过网络发送至服务器,服务器对该搜索请求进行处理后得到搜索结果,并将该搜索结果发送给所述终端设备中的信息搜索客户端。
请参见图2,图2是本申请实施例提供的一种信息搜索方法示意流程图。
本申请实施例提供的信息搜索方法可以由具备信息搜索功能的终端设备或服务器或其他类型的电子设备或系统实现,此处不作限定。为了便于理解,下文将信息搜索方法的执行主体称为信息搜索服务端。
S101、接收来自客户端的搜索关键字以及用户标识。
本申请的客户端可以是安装有本申请涉及的客户端应用程序(app)的手持设备、可穿戴设备、计算设备,其中所述手持设备包括手机、平板电脑等,所述可穿戴设备包括智能手表、智能手环等,所述计算设备包括笔记本电脑、台式电脑等。本申请的实施例对于客户端的表现形式不作具体限定。
在一些实现方式中,所述搜索关键字是用户在搜索栏中输入的关键字,所述关键字可以是以中文汉字形式,也可以是以中文拼音形式,还可以是以数字代码的形式等,本申请对关键字的具体表现形式不做具体限定。
本申请的用户标识可以是用户的IP(Internet Protocol,互联网协议)地址,用户在客户端应用程序注册的账号、身份等,本申请实施例对于用户标识的内容不作具体限定。
关于信息搜索服务端接收客户端发送的搜索关键字及用户标识的方式,本申请实施例不作具体限定,由于信息搜索客户端与信息搜索服务端进行有线或者无线的连接方式进行通信,因而信息搜索客户端可以包括但不限于采用将搜索关键字及用户标识打包成数据包,通过有线或无线的方式发送给搜索服务器端。
S102、根据所述搜索关键字进行搜索,获得多个搜索结果。
在一具体的实现方式中,预先在信息搜索服务端建立信息数据库,其中信息数据库存储有多个信息数据,所述信息数据可以是根据信息数据所属的类别分别存储在多个数据表中。通过将信息数据按照类别进行分别存储在不同的数据表中,可以提高信息搜索服务端检索相关信息数据的速度。
作为一种可选实施例,为了避免每次获取相关信息数据时都要从众多的信息资源中获取,信息搜索服务端在所述接收来自客户端的搜索关键字及用户标识之前,还包括:生成索引信息库,所述索引信息库包括所有信息数据的索引,从而可以在所述索引信息库中搜索所述搜索关键字所匹配的索引,然后通过所述索引在应用服务器中进行搜索,获得相关的搜索结果。所述索引是帮助数据库高效查询相关数据的数据结构。一般而言,数据库在执行一条查询语句的时候,默认的方式是根据搜索条件进行全表扫描,遇到匹配条件的就加入搜索结果集合。而我们对某一字段增加索引,查询时就会先去索引列表中一次定位到特定值的行数,大大减少遍历匹配的行数,因此增加索引能明显增加数据库查询的速度。具体的,所述索引可以包括主键索引、唯一索引、普通索引、全文索引、组合索引,本申请实施例还可以根据实际需求使用其他类型的索引,或者自定义的索引,本申请对索引的类型不作具体限定。
作为一种可选实施例,当信息搜索服务端得到搜索结果之后,信息搜索服务端得到的搜索结果中的信息可以是随意排列的顺序,也可以是根据一定的排序规则进行排列的顺序。根据一定的排序规则进行排列的顺序可以按照与搜索关键字的相关程度对搜索结果中的各个信息进行排序,从而得到排序后的搜索结果。例如,将与搜索关键字相关程度高的信息排列在前,与搜索关键字相关程度低的信息排列在后,或者,重要程度高的信息排列在前,重要程度低的信息排列在后。
当然,还可以按照各个信息中首字母的先后顺序或者信息的笔画数量等方式对搜索结果中的各个信息进行排序,关于对搜索结果中的各个信息进行排序的方式,本实施例对此不作具体限定。为了能够得到更为符合用户需求,即得到更具针对性的搜索结果排序列表,本实施例提供的方法在信息搜索服务端得到包含多个搜索结果之后,还包括后续处理步骤103和步骤104。
S103、获取所述用户标识对应的用户画像信息。
本申请实施例中,所述用户画像信息包括所述用户的属性标签以及所述用户的兴趣标签。所述用户的属性标签是根据用户的注册信息得到的,属性标签可以包括:性别、所属年龄段、工作类别、工作年限、家庭住址、婚姻状态、家庭成员组成等。用户的属性标签可以从用户注册账号填写的个人资料中获取,还可以通过从第三方应用授权获得,例如通过微信应用授权获取用户的个人信息,本申请对获取用户个人信息的途径不作具体限定。所述用户的兴趣标签是通过统计所述用户的历史浏览记录、所述用户的历史收藏记录、所述用户的历史下载记录、所述用户的历史评论记录和所述用户的历史消费记录中出现频次最高的一个或多个关键字词得到的。具体的,所述兴趣信息可以包括:用户的消费兴趣、阅读兴趣、饮食兴趣、运动兴趣等等,本申请对此不作具体限定。
在一些实施例中,在所述接收来自客户端的搜索关键字以及用户标识之前,获取所述用户的历史搜索信息;统计所述历史搜索信息中出现频次最高的一个或多个关键字词;根据所述一个或多个关键字词,在用户兴趣标签库中匹配一个或多个与所述关键字词相同或同义的所述兴趣标签。
在一些具体应用中,所述搜索服务端中预先设置用户兴趣标签库和同义词库,所述用户兴趣标签库存储着多个用户的兴趣标签,所述用户的兴趣标签根据不同的类别分别存储在不同的数据表中,具体可以分为:消费兴趣、阅读兴趣、饮食兴趣、运动兴趣等等;所述同义词库存储着与所述兴趣标签意思相近的同义词,以及每个兴趣标签对应各个同义词的距离分数,其中与兴趣标签含义越相近的同义词,距离分数越高,通过距离分数可以定量地表达出同义词与兴趣标签的关联程度。在所述搜索服务器预先设置了用户兴趣标签库和同义词库的条件下,根据用户的历史搜索信息得出用户的兴趣标签可以通过如下方式实现:通过文字匹配算法统计历史搜索结果信息中的文字信息出现频率最高的关键字词,然后在所述用户兴趣标签库中查找是否包括与关键字词相同的兴趣标签,若能查找到与关键字词相同的兴趣标签,将该兴趣标签作为用户的兴趣标签;若不能,则在同义词库中查找与该关键字词含义最相近(即距离分数最高)的兴趣标签,作为用户的兴趣标签。
在一些实施例中,若所述用户的历史搜索信息的信息量少于预设阈值,由于搜索信息的信息量过少,通过用户的历史搜索信息得到的兴趣标签的准确性较弱。鉴于此,本申请的解决方案是:为所述用户匹配与所述用户的属性标签相同的其他用户;将所述其他用户中出现频次最高的一个或多个兴趣标签,作为所述用户的一个或多个兴趣标签。通过大数据统计得到,相同性别,相同年龄,相同职业,相同家庭成员组成的人群的具有相同的兴趣的概率超过90%。基于此,本申请确定用户的兴趣标签方式还可以是:将与该用户属性标签相同的其他用户群体中最普遍的一个或多个兴趣标签作为该用户的兴趣标签。
S104、获取所述多个搜索结果中各个搜索结果与所述用户的属性标签的各个第一关联值,以及获取所述多个搜索结果中各个搜索结果与所述用户的兴趣标签的各个第二关联值。
在一些实施例中,步骤S104可以通过如下方式实现:根据所述各个搜索结果中出现与所述用户的属性标签相同或同义的关键字词的频次,获得所述各个搜索结果的各个第一关联值;根据所述各个搜索结果中出现与所述用户的兴趣标签相同或同义的关键字词的频次,获得所述各个搜索结果的各个第二关联值。其中所述各个第一关联值表征了各个搜索结果与用户的属性标签的关联程度,所述各个第二关联值表征了各个搜索结果与用户的兴趣标签的关联程度。具体实现中,所述第一关联值可以通过统计与所述用户的属性标签相同或同义的关键字词的频次得到,其中所述第一关联值与所述频次正相关,即所述频次越高,所述第一关联值越大,所述正相关包括线性正相关以及非线性正相关,所述线性正相关可以是符合公式(1)的线性正相关关系,所述非线性正相关可以是符合公式(2)的非线性正相关关系。
y1=a1x1+b1 公式(1)
y2=a2x2 q+b2x2 q-1+…+c2x2+d2 公式(2)
其中,公式(1)中:y1是第一关联值,x1是与所述用户的属性标签相同或同义的关键字词的频次,其中a1,b1是根据实际应用制定的常数;其中,公式(2)中:y2是第二关联值,x2是与所述用户的兴趣标签相同或同义的关键字词的频次,其中a2,b2,c2,d2,q是也是根据实际应用制定的常数。
在一些实施例中,所述第二关联值与所述第一关联值的确定方式类似,为了简洁,不再赘述。
在另一些实施例中,所述信息搜索服务端预先计算得到所述各个搜索结果与各个用户的属性标签的关联值,并存储在特定的数据表中的;同样地,所述信息搜索服务端预先计算得到所述各个搜索结果与各个用户的兴趣标签的关联值,并存储在特定的数据表中。当需要确定各个搜索结果与所述用户画像信息(即用户的属性标签和用户的兴趣标签)的关联值时,则从上述数据表中查询即可。预先计算并存储各个搜索结果与用户画像信息的关联值,有利于提高搜索速度。
S105、根据所述各个第一关联值的大小以及所述各个第二关联值的大小对所述多个搜索结果进行排序,得到所述搜索结果的排序列表。
在一些实施例中,所述根据所述各个第一关联值的大小以及所述各个第二关联值的大小对所述多个搜索结果进行排序,得到所述搜索结果的排序列表,包括:将所述各个第一关联值的大小和所述属性标签的排序权重的乘积,与所述各个第二关联值的大小和所述兴趣标签的排序权重的乘积进行求和,得到所述各个搜索结果对应的排序值;根据所述各个搜索结果对应的排序值的大小对所述各个搜索结果进行排序,得到所述搜索结果的排序列表。具体地,排序值可以通过如下公式(3)计算得到:
其中,P为所述排序值,为所述属性标签的排序权重,C1为所述第一关联值,为所述兴趣标签的排序权重,C2为所述第二关联值,其中w1是对属性标签的排序权重因子,w2是对兴趣标签的排序权重因子,w1和w2是常数值。
S106、将所述搜索结果的排序列表发送给所述客户端。
本实施例不对信息搜索服务端将搜索结果排序列表发送给客户端的方式进行限定,具体可以通过有线或无线的方式将搜索结果排序列表发送给客户端。
在本申请实施例中,首先,根据搜索关键字进行搜索得到多个搜索结果,然后,获取用户标识对应的用户画像信息,接着,基于各个搜索结果的信息内容与用户画像信息的关联程度,对多个搜索结果进行重新排序,使得与用户画像信息关联较强的用户画像信息排序在前,与用户画像信息关联较弱的用户画像信息排序在后,最后将搜索结果的排序列表发送给客户端。通过使用用户画像信息对搜索结果进行重新排序,使得重新排序后的搜索结果与用户的需求更加贴切,从而节约了用户花费在筛选信息的时间。
请参见图3,图3是本申请实施例提供的一种装置的结构示意图,该装置300包括:接收单元301,搜索单元302,获取单元303,排序单元304,发送单元305,所述接收单元301用于,接收来自客户端的搜索关键字以及用户标识;所述搜索单元302用于,根据所述搜索关键字进行搜索,获得多个搜索结果;所述获取单元303用于,获取所述用户标识对应的用户画像信息,所述用户画像信息包括所述用户的属性标签以及所述用户的兴趣标签;所述获取单元303还用于,获取所述多个搜索结果中各个搜索结果与所述用户的属性标签的各个第一关联值,以及获取所述多个搜索结果中各个搜索结果与所述用户的兴趣标签的各个第二关联值;所述排序单元304用于,根据所述各个第一关联值的大小以及所述各个第二关联值的大小对所述多个搜索结果进行排序,得到所述搜索结果的排序列表;所述发送单元305用于,将所述搜索结果的排序列表发送给所述客户端。
在一些实施例中,所述获取单元303具体用于,根据所述各个搜索结果中出现与所述用户的属性标签相同或同义的关键字词的频次,获得所述各个搜索结果的各个第一关联值;根据所述各个搜索结果中出现与所述用户的兴趣标签相同或同义的关键字词的频次,获得所述各个搜索结果的各个第二关联值。
在一些实施例中,所述排序单元304具体用于,将所述各个第一关联值的大小和所述属性标签的排序权重的乘积,与所述各个第二关联值的大小和所述兴趣标签的排序权重的乘积进行求和,得到所述各个搜索结果对应的排序值;根据所述各个搜索结果对应的排序值的大小对所述各个搜索结果进行排序,得到所述搜索结果的排序列表。
在一些实施例中,参见图4,所述装置还包括:统计单元401,匹配单元402,在所述接收来自客户端的搜索关键字以及用户标识之前,所述获取单元303还用于,获取所述用户的历史搜索信息;所述统计单元401用于,统计所述历史搜索信息中出现频次最高的一个或多个关键字词;所述匹配单元402用于,根据所述一个或多个关键字词,在用户兴趣标签库中匹配一个或多个与所述关键字词相同或同义的所述兴趣标签。
在一些实施例中,所述匹配单元402还用于,在所述接收来自客户端的搜索关键字以及用户标识之前,若所述用户的历史搜索信息的信息量少于预设阈值,为所述用户匹配与所述用户的属性标签相同的其他用户;将所述其他用户中出现频次最高的一个或多个兴趣标签,作为所述用户的一个或多个兴趣标签。
在一些实施例中,所述用户的属性标签是根据所述用户的注册信息得到的,所述用户的兴趣标签是通过统计所述用户的历史浏览记录、所述用户的历史收藏记录、所述用户的历史下载记录、所述用户的历史评论记录和所述用户的历史消费记录中出现频次最高的一个或多个关键字词得到的。
在一些实施例中,本申请实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
另外,本申请实施例提供了一种电子设备,图5是本申请实施例提供的一种电子设备结构框图。如图5所示,该电子设备包括:处理器501,用于存储处理器可执行指令的存储器,其中,所述处理器被配置为:执行上述信息搜索方法。
可选地,所述电子设备还可以包括:一个或多个输入接口502,一个或多个输出接口503和存储器504。
上述处理器501、输入接口502、输出接口503和存储器504通过总线505连接。存储器502用于存储指令,处理器501用于执行存储器502存储的指令。其中,处理器501被配置用于调用所述程序指令执行:
通过输入接口502,接收来自客户端的搜索关键字以及用户标识;
根据所述搜索关键字进行搜索,获得多个搜索结果;
通过输入接口502,获取所述用户标识对应的用户画像信息,所述用户画像信息包括所述用户的属性标签以及所述用户的兴趣标签;
通过输入接口502,获取所述多个搜索结果中各个搜索结果与所述用户的属性标签的各个第一关联值,以及获取所述多个搜索结果中各个搜索结果与所述用户的兴趣标签的各个第二关联值;
根据所述各个第一关联值的大小以及所述各个第二关联值的大小对所述多个搜索结果进行排序,得到所述搜索结果的排序列表;
通过输出接口503,将所述搜索结果的排序列表发送给所述客户端。
应当理解,在本申请实施例中,所称处理器501可以是中央处理单元(CentralProcessing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
该存储器504可以包括只读存储器和随机存取存储器,并向处理器501提供指令和数据。存储器504的一部分还可以包括非易失性随机存取存储器。例如,存储器504还可以存储设备类型的信息。
在一些实现方式中,本申请实施例中所描述的电子设备用于执行上文描述的信息搜索方法,相应地,处理器501用于执行本申请实施例提供的信息搜索方法的各个实施例中的步骤和/或流程,在此不再赘述。
在本申请的另一实施例中提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时实现上文描述的信息搜索方法,具体实现可参照上文方法实施例描述的信息搜索方法的各个实施例中的步骤和/或流程,为了简洁,在此不再赘述。
所述计算机可读存储介质可以是前述任一实施例所述的电子设备的内部存储单元,例如终端的硬盘或内存。所述计算机可读存储介质也可以是所述终端的外部存储设备,例如所述终端上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述计算机可读存储介质还可以既包括所述电子设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述电子设备所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本领域普通技术人员可以意识到,结合本文中所申请的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的服务器、设备和单元的具体工作过程,可以参考前述方法实施例中的对应过程,也可执行发明实施例所描述的电子设备的实现方式,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的服务器、设备和方法,可以通过其它的方式实现。例如,以上所描述的服务器实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本申请实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种信息搜索方法,其特征在于,包括:
接收来自客户端的搜索关键字以及用户标识;
根据所述搜索关键字进行搜索,获得多个搜索结果;
获取所述用户标识对应的用户画像信息,所述用户画像信息包括所述用户的属性标签以及所述用户的兴趣标签;
获取所述多个搜索结果中各个搜索结果与所述用户的属性标签的各个第一关联值,以及获取所述多个搜索结果中各个搜索结果与所述用户的兴趣标签的各个第二关联值;
根据所述各个第一关联值的大小以及所述各个第二关联值的大小对所述多个搜索结果进行排序,得到所述搜索结果的排序列表;
将所述搜索结果的排序列表发送给所述客户端。
2.根据权利要求1所述的方法,其特征在于,所述获取所述多个搜索结果中各个搜索结果与所述用户的属性标签的各个第一关联值,以及获取所述多个搜索结果中各个搜索结果与所述用户的兴趣标签的各个第二关联值,包括:
根据所述各个搜索结果中出现与所述用户的属性标签相同或同义的关键字词的频次,获得所述各个搜索结果的各个第一关联值;
根据所述各个搜索结果中出现与所述用户的兴趣标签相同或同义的关键字词的频次,获得所述各个搜索结果的各个第二关联值。
3.根据权利要求2所述的方法,其特征在于,所述根据所述各个第一关联值的大小以及所述各个第二关联值的大小对所述多个搜索结果进行排序,得到所述搜索结果的排序列表,包括:
将所述各个第一关联值的大小和所述属性标签的排序权重的乘积,与所述各个第二关联值的大小和所述兴趣标签的排序权重的乘积进行求和,得到所述各个搜索结果对应的排序值;
根据所述各个搜索结果对应的排序值的大小对所述各个搜索结果进行排序,得到所述搜索结果的排序列表。
4.根据权利要求1所述的方法,其特征在于,在所述接收来自客户端的搜索关键字以及用户标识之前,所述方法还包括:
获取所述用户的历史搜索信息;
统计所述历史搜索信息中出现频次最高的一个或多个关键字词;
根据所述一个或多个关键字词,在用户兴趣标签库中匹配一个或多个与所述关键字词相同或同义的所述兴趣标签。
5.根据权利要求4所述的方法,其特征在于,在所述接收来自客户端的搜索关键字以及用户标识之前,所述方法还包括:
若所述用户的历史搜索信息的信息量少于预设阈值,为所述用户匹配与所述用户的属性标签相同的其他用户;
将所述其他用户中出现频次最高的一个或多个兴趣标签,作为所述用户的一个或多个兴趣标签。
6.根据权利要求1所述的方法,其特征在于,所述用户的属性标签是根据所述用户的注册信息得到的,所述用户的兴趣标签是通过统计所述用户的历史浏览记录、所述用户的历史收藏记录、所述用户的历史下载记录、所述用户的历史评论记录和所述用户的历史消费记录中出现频次最高的一个或多个关键字词得到的。
7.一种信息搜索装置,其特征在于,所述装置包括:接收单元,搜索单元,获取单元,排序单元,发送单元,
所述接收单元用于,接收来自客户端的搜索关键字以及用户标识;
所述搜索单元用于,根据所述搜索关键字进行搜索,获得多个搜索结果;
所述获取单元用于,获取所述用户标识对应的用户画像信息,所述用户画像信息包括所述用户的属性标签以及所述用户的兴趣标签;
所述获取单元还用于,获取所述多个搜索结果中各个搜索结果与所述用户的属性标签的各个第一关联值,以及获取所述多个搜索结果中各个搜索结果与所述用户的兴趣标签的各个第二关联值;
所述排序单元用于,根据所述各个第一关联值的大小以及所述各个第二关联值的大小对所述多个搜索结果进行排序,得到所述搜索结果的排序列表;
所述发送单元用于,将所述搜索结果的排序列表发送给所述客户端。
8.根据权利要求7所述的装置,其特征在于,所述获取单元具体用于,
根据所述各个搜索结果中出现与所述用户的属性标签相同或同义的关键字词的频次,获得所述各个搜索结果的各个第一关联值;
根据所述各个搜索结果中出现与所述用户的兴趣标签相同或同义的关键字词的频次,获得所述各个搜索结果的各个第二关联值。
9.一种电子设备,其特征在于,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,对所述指令的调用使得所述处理器执行权利要求1-6中任一权利要求所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1-6中任一权利要求所述的方法。
CN201910420836.XA 2019-05-20 2019-05-20 一种信息搜索方法以及相关设备 Pending CN110245289A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910420836.XA CN110245289A (zh) 2019-05-20 2019-05-20 一种信息搜索方法以及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910420836.XA CN110245289A (zh) 2019-05-20 2019-05-20 一种信息搜索方法以及相关设备

Publications (1)

Publication Number Publication Date
CN110245289A true CN110245289A (zh) 2019-09-17

Family

ID=67884647

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910420836.XA Pending CN110245289A (zh) 2019-05-20 2019-05-20 一种信息搜索方法以及相关设备

Country Status (1)

Country Link
CN (1) CN110245289A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110851727A (zh) * 2019-11-19 2020-02-28 青岛聚看云科技有限公司 搜索结果的排序方法及服务器
CN111078998A (zh) * 2019-11-19 2020-04-28 Oppo(重庆)智能科技有限公司 信息检索方法、装置、存储介质及服务器
CN111177551A (zh) * 2019-12-27 2020-05-19 百度在线网络技术(北京)有限公司 确定搜索结果的方法、装置、设备和计算机存储介质
CN111753199A (zh) * 2020-06-22 2020-10-09 北京百度网讯科技有限公司 用户画像构建方法及设备、电子设备和介质
CN112199483A (zh) * 2020-10-10 2021-01-08 深圳壹账通智能科技有限公司 信息录入辅助方法、装置、电子设备及存储介质
CN112559902A (zh) * 2020-12-15 2021-03-26 广州市贺氏办公设备有限公司 一种社区成员排名方法、系统、装置及介质
CN112559902B (zh) * 2020-12-15 2024-06-04 广州市贺氏办公设备有限公司 一种社区成员排名方法、系统、装置及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104182488A (zh) * 2014-08-08 2014-12-03 腾讯科技(深圳)有限公司 搜索方法、服务器及客户端
CN105320706A (zh) * 2014-08-05 2016-02-10 阿里巴巴集团控股有限公司 搜索结果的处理方法和装置
CN105677927A (zh) * 2016-03-31 2016-06-15 百度在线网络技术(北京)有限公司 用于提供搜索结果的方法和装置
CN106776860A (zh) * 2016-11-28 2017-05-31 北京三快在线科技有限公司 一种搜索摘要生成方法及装置
CN107885889A (zh) * 2017-12-13 2018-04-06 聚好看科技股份有限公司 搜索结果的反馈方法、展示方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105320706A (zh) * 2014-08-05 2016-02-10 阿里巴巴集团控股有限公司 搜索结果的处理方法和装置
CN104182488A (zh) * 2014-08-08 2014-12-03 腾讯科技(深圳)有限公司 搜索方法、服务器及客户端
CN105677927A (zh) * 2016-03-31 2016-06-15 百度在线网络技术(北京)有限公司 用于提供搜索结果的方法和装置
CN106776860A (zh) * 2016-11-28 2017-05-31 北京三快在线科技有限公司 一种搜索摘要生成方法及装置
CN107885889A (zh) * 2017-12-13 2018-04-06 聚好看科技股份有限公司 搜索结果的反馈方法、展示方法及装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110851727A (zh) * 2019-11-19 2020-02-28 青岛聚看云科技有限公司 搜索结果的排序方法及服务器
CN111078998A (zh) * 2019-11-19 2020-04-28 Oppo(重庆)智能科技有限公司 信息检索方法、装置、存储介质及服务器
CN111078998B (zh) * 2019-11-19 2024-03-12 Oppo(重庆)智能科技有限公司 信息检索方法、装置、存储介质及服务器
CN111177551A (zh) * 2019-12-27 2020-05-19 百度在线网络技术(北京)有限公司 确定搜索结果的方法、装置、设备和计算机存储介质
US11734373B2 (en) 2019-12-27 2023-08-22 Baidu Online Network Technology (Beijing) Co., Ltd. Method, apparatus, device and computer storage medium for determining search result
CN111753199A (zh) * 2020-06-22 2020-10-09 北京百度网讯科技有限公司 用户画像构建方法及设备、电子设备和介质
CN111753199B (zh) * 2020-06-22 2024-05-10 北京百度网讯科技有限公司 用户画像构建方法及设备、电子设备和介质
CN112199483A (zh) * 2020-10-10 2021-01-08 深圳壹账通智能科技有限公司 信息录入辅助方法、装置、电子设备及存储介质
WO2022073513A1 (zh) * 2020-10-10 2022-04-14 深圳壹账通智能科技有限公司 信息录入辅助方法、装置、电子设备及存储介质
CN112199483B (zh) * 2020-10-10 2023-03-17 深圳壹账通智能科技有限公司 信息录入辅助方法、装置、电子设备及存储介质
CN112559902A (zh) * 2020-12-15 2021-03-26 广州市贺氏办公设备有限公司 一种社区成员排名方法、系统、装置及介质
CN112559902B (zh) * 2020-12-15 2024-06-04 广州市贺氏办公设备有限公司 一种社区成员排名方法、系统、装置及介质

Similar Documents

Publication Publication Date Title
CN110245289A (zh) 一种信息搜索方法以及相关设备
US9430568B2 (en) Method and system for querying information
US9514202B2 (en) Information processing apparatus, information processing method, program for information processing apparatus and recording medium
CN102906736B (zh) 用于匹配实体的系统和方法及其中使用的同义词群组织器
EP2065850B1 (en) Method, system and apparatus for collecting user information
CN108804642A (zh) 检索方法、装置、计算机设备及存储介质
CN108566666B (zh) Wi-Fi热点推荐方法、装置及存储介质
CN102968417A (zh) 一种应用于计算机网络中的搜索方法和系统
CN109829073B (zh) 一种图像搜索的方法及装置
CN109977316A (zh) 一种并行式文章推荐方法、装置、设备及存储介质
CN110209659A (zh) 一种简历过滤方法、系统和计算机可读存储介质
CN111428007B (zh) 基于跨平台的同步推送反馈方法
CN108536665A (zh) 一种确定语句一致性的方法及装置
CN110245357B (zh) 主实体识别方法和装置
CN106933864A (zh) 一种搜索引擎系统及其搜索方法
CN104462347A (zh) 关键词的分类方法及装置
CN103500222A (zh) 通信软件聊天对象的搜索方法及装置
JP2004127196A (ja) コミュニティ形成支援システム、その端末、サーバ及びプログラム
CN113886708A (zh) 基于用户信息的产品推荐方法、装置、设备及存储介质
CN109446301A (zh) 一种相似文章的查找方法及装置
CN110990701B (zh) 书籍搜索方法、计算设备及计算机存储介质
CN109462635B (zh) 一种信息推送方法、计算机可读存储介质及服务器
CN108255888B (zh) 一种数据处理方法及系统
CN113609396A (zh) 涉网事件线索搜集方法、系统、电子装置和存储介质
CN114282119A (zh) 一种基于异构信息网络的科技信息资源检索方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination