CN108304421A - 一种信息搜索方法及装置 - Google Patents

一种信息搜索方法及装置 Download PDF

Info

Publication number
CN108304421A
CN108304421A CN201710103636.2A CN201710103636A CN108304421A CN 108304421 A CN108304421 A CN 108304421A CN 201710103636 A CN201710103636 A CN 201710103636A CN 108304421 A CN108304421 A CN 108304421A
Authority
CN
China
Prior art keywords
information
search result
user
title
input information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710103636.2A
Other languages
English (en)
Other versions
CN108304421B (zh
Inventor
康战辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201710103636.2A priority Critical patent/CN108304421B/zh
Publication of CN108304421A publication Critical patent/CN108304421A/zh
Application granted granted Critical
Publication of CN108304421B publication Critical patent/CN108304421B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了信息搜索方法及装置,应用于信息处理技术领域。在本实施例的方法中,服务器会分别计算用户输入信息的多条搜索结果对应的内容信息,与用户输入信息的相关信息的匹配度,然后根据多条搜索结果对应的匹配度调整多条搜索结果的排序位置。这样可以确定搜索结果的具体内容与用户输入信息的实际相关性,基于确定的实际相关性对多条搜索结果的排序位置调整后,可以避免服务器将标题与用户输入信息相关,而具体内容与用户输入信息无关的搜索结果排在前面,并返回给客户端。

Description

一种信息搜索方法及装置
技术领域
本发明涉及信息处理技术领域,特别涉及一种信息搜索方法及装置。
背景技术
随着信息网络的发展,用户通过搜索查找感兴趣的信息成为一种刚需,现有的很多系统都具有搜索功能,用户一般通过客户端输入关键字并发起搜索请求,然后服务器会根据用户输入的关键字,经过经典的检索模型,排序模型,点击模型等,在考虑文本相关性,时新性,权威度等因子基础上将最新最权威的结果排前并返回给客户端。
为了吸引用户的注意,现在许多信息的标题中包含热门搜索词,但是信息的具体内容却与其标题的关系不大,这样当用户通过客户端输入这些热门搜索词时,服务器采用上述现有技术的方法返回给客户端的搜索结果中,这些类似信息就会排在前面,从而影响了用户对目标信息的查询。
发明内容
本发明实施例提供一种信息搜索方法及装置,实现了根据搜索结果对应的内容信息与用户输入信息的相关信息的匹配度调整搜索结果的排序位置。
本发明实施例提供一种信息搜索方法,包括:
根据用户输入信息获取多条搜索结果,所述多条搜索结果中每一条搜索结果分别对应一排序位置;
分别获取所述多条搜索结果对应的内容信息,及获取所述用户输入信息的相关信息;
分别计算所述多条搜索结果对应的内容信息与所述相关信息的匹配度;
根据所述多条搜索结果对应的匹配度调整所述多条搜索结果的排序位置。
本发明实施例还提供一种信息搜索装置,包括:
搜索单元,用于根据用户输入信息获取多条搜索结果,所述多条搜索结果中每一条搜索结果分别对应一排序位置;
信息获取单元,用于分别获取所述多条搜索结果对应的内容信息,及获取所述用户输入信息的相关信息;
匹配计算单元,用于分别计算所述多条搜索结果对应的内容信息与所述相关信息的匹配度;
调整单元,用于根据所述多条搜索结果对应的匹配度调整所述多条搜索结果的排序位置。
可见,在本实施例的方法中,服务器会分别计算用户输入信息的多条搜索结果对应的内容信息,与用户输入信息的相关信息的匹配度,然后根据多条搜索结果对应的匹配度调整多条搜索结果的排序位置。这样可以确定搜索结果的具体内容与用户输入信息的实际相关性,基于确定的实际相关性对多条搜索结果的排序位置调整后,可以避免服务器将标题与用户输入信息相关,而具体内容与用户输入信息无关的搜索结果排在前面,并返回给客户端。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种信息搜索方法的流程图;
图2是本发明实施例中获取多条搜索结果的方法流程图;
图3是本发明应用实施例提供的一种信息搜索方法的流程图;
图4是本发明实施例提供的一种信息搜索装置的结构示意图;
图5是本发明实施例提供的另一种信息搜索装置的结构示意图;
图6是本发明实施例提供的一种服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排它的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供一种信息搜索方法,主要应用于具有搜索功能的系统中,该系统包括客户端和服务器,本实施例的方法是系统中的服务器所执行的方法,流程图如图1所示,包括:
步骤101,根据用户输入信息获取多条搜索结果,多条搜索结果中每一条搜索结果分别对应一排序位置。
可以理解,具有搜索功能的系统中客户端会提供搜索接口,这样用户可以在搜索接口输入信息,并通过客户端发起搜索请求,在搜索请求中包括用户输入信息,当系统中的服务器接收到搜索请求,会根据搜索请求中的用户输入信息进行搜索,得到多条搜索结果。
一般情况下,服务器会根据一定的规则,选定标题中出现用户输入信息的多条信息,并将多条信息的列表作为搜索结果(即多条搜索结果)返回给客户端,且返回给客户端的多条搜索结果是按照一定顺序进行排列的,比如服务器可以将与上述用户输入信息的相关度较大的搜索结果排在前面。其中,每一条搜索结果都可以包括对应一条信息的排序位置,地址信息和标题等。
步骤102,分别获取多条搜索结果对应的内容信息,及获取用户输入信息的相关信息。
这里一条搜索结果对应的内容信息可以通过多种形式来表示,比如通过语义表达词来表示等。用户输入信息的相关信息是指与该用户输入信息具有同一特征信息的信息,或是与用户输入信息具有一定关系(比如所属关系或因果关系等)的信息,比如与用户输入信息的内容分类相同的信息,或是包含在用户输入信息中的信息等。
具体地,在一种情况下,服务器在获取某一条搜索结果对应的内容信息时,可以在某一条搜索结果对应的内容中,提取多个语义表达词作为某一条搜索结果对应的内容信息。这里语义表达词是指可以表达该条搜索结果对应内容的语义的词,一般是基于词性,词频和词权重等特征进行提取,即根据词性,词频和词权重等特征对该条搜索结果对应内容中的各个组成词进行打分,将分数较高的多个组成词作为语义表达词。
在获取用户输入信息的相关信息时,可以从该用户输入信息的知识图谱中获取到。例如,用户输入信息为“腾讯”,在知识图谱中与“腾讯”相关的词包括“微信”,“QQ”,“财付通”等,则“微信”,“QQ”,“财付通”等这些词为用户输入信息“腾讯”的相关信息。
步骤103,分别计算多条搜索结果对应的内容信息与相关信息的匹配度。
具体地,如果某一条搜索结果对应的内容信息包括多个语义表达词,则服务器在计算某一条搜索结果对应的内容信息与相关信息的匹配度时,先分别确定某一条搜索结果对应的多个语义表达词与相关信息的匹配分数,然后将多个语义表达词与相关信息的匹配分数基于某一函数的计算值作为某一条搜索结果对应的内容信息与相关信息的匹配度。
其中,在确定某一语义表达词与相关信息的匹配分数时,如果该语义表达词与相关信息完全不匹配,则确定匹配分数为0,如果该语义表达词与相关信息不完全匹配,则确定匹配分数为1,如果该语义表达词与相关信息完全匹配,则确定匹配分数为2。而多个语义表达词与相关信息的匹配分数基于某一函数的计算值,可以是基于任一函数的计算值,比如多个语义表达词与相关信息的匹配分数的相加值与语义表达词的个数的比值等。
步骤104,根据多条搜索结果对应的匹配度调整多条搜索结果的排序位置。
由于上述步骤101中在获取多条搜索结果时,这多条搜索结果已经按照一定的顺序排列,在本实施例中,服务器需要通过各条搜索结果对应的匹配度调整多条搜索结果的排序位置。具体地,服务器可以将匹配度不在预置范围的搜索结果的排序位置向后调整,服务器还可以将匹配度为零的搜索结果去掉。
可见,在本实施例的方法中,服务器会分别计算用户输入信息的多条搜索结果对应的内容信息,与用户输入信息的相关信息的匹配度,然后根据多条搜索结果对应的匹配度调整多条搜索结果的排序位置。这样可以确定搜索结果的具体内容与用户输入信息的实际相关性,基于确定的实际相关性对多条搜索结果的排序位置调整后,可以避免服务器将标题与用户输入信息相关,而具体内容与用户输入信息无关的搜索结果排在前面,并返回给客户端。
上述步骤101到104是服务器在根据用户输入信息得到已排序的多条搜索结果后,再按照一定的规则对这多条搜索结果的排序位置进行调整,在另一个具体的实施例中,服务器在执行上述步骤101时,在获取多条搜索结果的过程中,已经考虑到标题中包括用户输入信息的信息的具体内容与用户输入信息的实际相关性。则服务器在执行上述步骤101时,可以通过如下步骤来实现,流程图参考图2所示,包括:
步骤201,确定标题中包含用户输入信息的多条信息。
步骤202,分别确定多条信息的标题中各个关键词的权重值,在多条信息中任一条信息的标题对应的关键词中包括了上述用户输入信息。
具体地,服务器可以分别根据多条信息的内容信息确定多条信息的标题中各个关键词的权重值,比如,先设置用户输入信息的权重值较大,如果某一条信息的内容信息与该用户输入信息的关联度较小,则降低用户输入信息在该条信息的标题中的权重值,从而增加该条信息的标题中实际能表达具体内容的关键词的权重值。
步骤203,根据多条信息的标题中各个关键词的权重值分别确定多条信息与用户输入信息的相关性分数。对于任一条信息与用户输入信息的相关性分数,服务器可以将该条信息的标题中各个关键词的权重值基于每一函数的计算值作为该条信息与用户输入信息的相关性分数,比如,将各个关键词分别与用户输入信息的相关性值与相应的权重值相乘后再相加得到的相加值作为该条信息的相关性分数等。
步骤204,根据相关性分数在多条信息中获取多条搜索结果。
其中,服务器可以直接在多条信息中选定相关性分数较大的部分信息,将选定的部分信息的列表作为多条搜索结果,且基于相关性分数对选定的部分信息的排序即为多条搜索结果的排序。服务器也可以再结合其它因素,比如权威性等因素,得到多条信息的综合性分数,并从多条信息中选定综合分数较大的部分信息,然后将选定的部分信息的列表作为多条搜索结果,且基于综合性分数对选定的部分信息的排序即为多条搜索结果的排序。
需要说明的是,在执行上述步骤202中确定权重值的步骤时,服务器可以事先离线根据各条信息的内容信息确定多条信息的标题中各个关键词的权重值,并储存到服务器的存储介质中,当用户通过客户端发起搜索请求时,服务器直接从存储介质中获取到,这样可以节省服务器向客户端返回搜索结果的时间。另一种情况下,在执行上述步骤202中确定权重值的步骤时,服务器也可以是当用户通过客户端发起搜索请求时,在线根据各条信息的内容信息确定多条信息的标题中各个关键词的权重值。
可见,在本实施例中,服务器在获取多条搜索结果的过程中,已经考虑到用户输入信息与各条信息的具体内容的实际关联度。
在这种情况下,服务器还可以在执行上述步骤101之后,确定搜索结果的条数是否大于预置的值,如果大于,则继续执行上述步骤102到104后,将调整排序位置后的多条搜索结果返回给客户端;如果不大于,可以不需要对多条搜索结果的排序位置进行调整,而直接将步骤101获取的多条搜索结果返回给客户端。
以下以一个具体的实施例来说明本发明的信息搜索方法,在本实施例中,以影视综艺名的搜索为例说明,流程图如图3所示,具体包括:
步骤301,用户在客户端提供的搜索接口输入“影视综艺名1”,比如“奔跑吧兄弟”,并发起搜索请求,在搜索请求中包括“影视综艺名1”。
步骤302,服务器接收到搜索请求,根据搜索请求中的“影视综艺名1”进行搜索操作得到多条搜索结果,每条搜索结果都包括对应的排序位置,标题和地址等信息。
步骤303,服务器在每条搜索结果对应的内容中,提取多个语义表达词作为相应搜索结果的内容信息。
步骤304,服务器在知识图谱中查找与“影视综艺名1”相关的信息,具体可以包括该影视综艺名1的相关演员,导演及分类信息等,比如,“奔跑吧兄弟”的相关信息可以包括“邓超”,“陈赫”,“鹿晗”,“王宝强”等。
步骤305,服务器计算每条搜索结果对应的多个语义表达词与“影视综艺名1”的相关信息的匹配度。具体地,某一条搜索结果对应的匹配度可以通过如下公式计算:
匹配度=(MatchScore(tag1,KG)+MatchScore(tag2,KG)+…+MatchScore(tagN,KG))/n
其中,tag1,tag2,…,tagN为一条搜索结果对应的多个语义表达词;KG为“影视综艺名1”的相关信息的全集;n为一条搜索结果对应的语义表达词的个数。MatchScore(tagi,KG)表示某一个语义表达词i与KG的匹配分数,如果语义表达词与KG完全匹配,则匹配分数可以为2,如果语义表达词与KG不完全匹配,则匹配分数可以为1,如果语义表达词与KG完全不匹配,则匹配非分数可以为0。
比如,服务器针对用户输入信息“奔跑吧兄弟”得到的某一条搜索结果的3个语义表达词为“王小宝”,“真人秀”,“拔河”,而“奔跑吧兄弟”的相关信息KG包括“邓超”,“陈赫”,“鹿晗”,“王宝强”等,则语义表达词“王小宝”与KG的匹配分数为0,语义表达词“真人秀”与KG的匹配分数为2,语义表达词“拔河”与KG中某一期“奔跑吧兄弟”中某一个项目匹配,对应的匹配分数为1。
步骤306,服务器根据多条搜索结果对应的匹配度调整多条搜索结果的排序位置。
具体地,服务器可以将匹配度小于预置的值(比如0.6)的搜索结果的排序位置向后移,还可以将匹配度为0的搜索结果去除等。
本发明实施例还提供一种信息搜索装置,其结构示意图如图4所示,具体可以包括:
搜索单元10,用于根据用户输入信息获取多条搜索结果,所述多条搜索结果中每一条搜索结果分别对应一排序位置;
信息获取单元11,用于分别获取所述搜索单元10获取的多条搜索结果对应的内容信息,及获取所述用户输入信息的相关信息;
所述信息获取单元11在获取某一条搜索结果对应的内容信息时,具体用于在所述某一条搜索结果对应的内容中,提取多个语义表达词作为所述某一条搜索结果对应的内容信息。
匹配计算单元12,用于分别计算所述信息获取单元11获取的多条搜索结果对应的内容信息与所述相关信息的匹配度;
所述匹配计算单元12在计算某一条搜索结果对应的内容与相关信息的匹配度时,具体用于分别确定所述某一条搜索结果对应的多个语义表达词与所述相关信息的匹配分数;将所述多个语义表达词与所述相关信息的匹配分数基于某一函数的计算值作为所述某一条搜索结果对应的内容信息与所述相关信息的匹配度。
调整单元13,用于根据所述匹配计算单元12计算的多条搜索结果对应的匹配度调整所述多条搜索结果的排序位置。
由于上述搜索单元10在获取多条搜索结果时,这多条搜索结果已经按照一定的顺序排序,在本实施例中,调整单元13需要通过各条搜索结果对应的匹配度调整多条搜索结果的排序位置。具体地,调整单元13可以将匹配度不在预置范围的搜索结果的排序位置向后调整,调整单元13还可以将匹配度为零的搜索结果去掉。
可见,在本实施例的装置中,匹配计算单元12会分别计算用户输入信息的多条搜索结果对应的内容信息,与用户输入信息的相关信息的匹配度,然后调整单元13根据多条搜索结果对应的匹配度调整多条搜索结果的排序位置。这样可以确定搜索结果的具体内容与用户输入信息的实际相关性,基于确定的实际相关性对多条搜索结果的排序位置调整后,可以避免本实施例的装置将标题与用户输入信息相关,而具体内容与用户输入信息无关的搜索结果排在前面,并返回给客户端。
参考图5所示,在一个具体的实施例中,信息搜索装置除了可以包括如图4所示的结构外,还可以包括条数确定单元14和结果返回单元15,在本实施例中:
搜索单元10,具体用于确定标题中包含所述用户输入信息的多条信息;分别确定所述多条信息的标题中各个关键词的权重值;所述多条信息中任一条信息的标题对应的关键词中包括所述用户输入信息;根据所述多条信息的标题中各个关键词的权重值分别确定所述多条信息与所述用户输入信息的相关性分数;根据所述相关性分数在所述多条信息中获取多条搜索结果。其中,搜索单元10在确定权重值时,分别根据所述多条信息的内容信息确定所述多条信息的标题中各个关键词的权重值。
条数确定单元14,用于在搜索单元10获取了多条搜索结果后,确定所述搜索结果的条数是否大于预置的值,如果大于,则通知所述信息获取单元11获取内容信息和相关信息,如果不大于,通知结果返回单元15将所述多条搜索结果返回给客户端;
结果返回单元15,用于将所述多条搜索结果返回给客户端。
需要说明的是,搜索单元10在确定权重值时,可以事先离线根据各条信息的内容信息确定多条信息的标题中各个关键词的权重值,并储存到信息搜索装置的存储介质中,当用户通过客户端发起搜索请求时,搜索单元10直接从存储介质中获取到,这样可以节省信息搜索装置向客户端返回搜索结果的时间。另一种情况下,搜索单元10在确定权重值时,也可以是当用户通过客户端发起搜索请求时,在线根据各条信息的内容信息确定多条信息的标题中各个关键词的权重值。
在本实施例中,当调整单元13调整了多条搜索结果的排序位置后,可以由结果返回单元15将调整排序位置的多条搜索结果返回给客户端。
本发明实施例还提供一种服务器,其结构示意图如图6所示,该服务器可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessing units,CPU)20(例如,一个或一个以上处理器)和存储器21,一个或一个以上存储应用程序221或数据222的存储介质22(例如一个或一个以上海量存储设备)。其中,存储器21和存储介质22可以是短暂存储或持久存储。存储在存储介质22的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器20可以设置为与存储介质22通信,在服务器上执行存储介质22中的一系列指令操作。
具体地,在存储介质22中储存的应用程序221包括信息搜索的应用程序,且该程序可以包括上述信息搜索装置中的搜索单元10,信息获取单元11,匹配计算单元12,调整单元13,条数确定单元14及结果返回单元15,在此不进行赘述。更进一步地,中央处理器20可以设置为与存储介质22通信,在服务器上执行存储介质22中储存的信息搜索的应用程序对应的一系列操作。
服务器还可以包括一个或一个以上电源23,一个或一个以上有线或无线网络接口24,一个或一个以上输入输出接口25,和/或,一个或一个以上操作系统223,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述方法实施例中所述的由服务器所执行的步骤可以基于该图6所示的服务器的结构。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM)、随机存取存储器RAM)、磁盘或光盘等。
以上对本发明实施例所提供的信息搜索方法及装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (12)

1.一种信息搜索方法,其特征在于,包括:
根据用户输入信息获取多条搜索结果,所述多条搜索结果中每一条搜索结果分别对应一排序位置;
分别获取所述多条搜索结果对应的内容信息,及获取所述用户输入信息的相关信息;
分别计算所述多条搜索结果对应的内容信息与所述相关信息的匹配度;
根据所述多条搜索结果对应的匹配度调整所述多条搜索结果的排序位置。
2.如权利要求1所述的方法,其特征在于,获取所述多条搜索结果中某一条搜索结果对应的内容信息,具体包括:
在所述某一条搜索结果对应的内容中,提取多个语义表达词作为所述某一条搜索结果对应的内容信息。
3.如权利要求2所述的方法,其特征在于,计算所述多条搜索结果中某一条搜索结果对应的内容信息与所述相关信息的匹配度,具体包括:
分别确定所述某一条搜索结果对应的多个语义表达词与所述相关信息的匹配分数;
将所述多个语义表达词与所述相关信息的匹配分数基于某一函数的计算值作为所述某一条搜索结果对应的内容信息与所述相关信息的匹配度。
4.如权利要求1至3任一项所述的方法,其特征在于,所述根据用户输入信息获取多条搜索结果,具体包括:
确定标题中包含所述用户输入信息的多条信息;
分别确定所述多条信息的标题中各个关键词的权重值;所述多条信息中任一条信息的标题对应的关键词中包括所述用户输入信息;
根据所述多条信息的标题中各个关键词的权重值分别确定所述多条信息与所述用户输入信息的相关性分数;
根据所述相关性分数在所述多条信息中获取多条搜索结果。
5.如权利要求4所述的方法,其特征在于,所述分别确定所述多条信息的标题中各个关键词的权重值,具体包括:
分别根据所述多条信息的内容信息确定所述多条信息的标题中各个关键词的权重值。
6.如权利要求5所述的方法,其特征在于,所述根据用户输入信息获取多条搜索结果之后,所述方法还包括:
确定所述搜索结果的条数是否大于预置的值,如果大于,则执行所述获取内容信息和相关信息,计算匹配度及调整所述多条搜索结果的排序位置的步骤,如果不大于,将所述多条搜索结果返回给客户端。
7.一种信息搜索装置,其特征在于,包括:
搜索单元,用于根据用户输入信息获取多条搜索结果,所述多条搜索结果中每一条搜索结果分别对应一排序位置;
信息获取单元,用于分别获取所述多条搜索结果对应的内容信息,及获取所述用户输入信息的相关信息;
匹配计算单元,用于分别计算所述多条搜索结果对应的内容信息与所述相关信息的匹配度;
调整单元,用于根据所述多条搜索结果对应的匹配度调整所述多条搜索结果的排序位置。
8.如权利要求7所述的装置,其特征在于,
所述信息获取单元,具体用于在所述某一条搜索结果对应的内容中,提取多个语义表达词作为所述某一条搜索结果对应的内容信息。
9.如权利要求8所述的装置,其特征在于,
所述匹配计算单元,具体用于分别确定所述某一条搜索结果对应的多个语义表达词与所述相关信息的匹配分数;将所述多个语义表达词与所述相关信息的匹配分数基于某一函数的计算值作为所述某一条搜索结果对应的内容信息与所述相关信息的匹配度。
10.如权利要求7至9任一项所述的装置,其特征在于,
所述搜索单元,具体用于确定标题中包含所述用户输入信息的多条信息;分别确定所述多条信息的标题中各个关键词的权重值,所述多条信息中任一条信息的标题对应的关键词中包括所述用户输入信息;根据所述多条信息的标题中各个关键词的权重值分别确定所述多条信息与所述用户输入信息的相关性分数;根据所述相关性分数在所述多条信息中获取多条搜索结果。
11.如权利要求10所述的装置,其特征在于,
所述搜索单元,具体用于分别根据所述多条信息的内容信息确定所述多条信息的标题中各个关键词的权重值。
12.如权利要求10所述的装置,其特征在于,还包括:
条数确定单元,用于确定所述搜索结果的条数是否大于预置的值,如果大于,则通知所述信息获取单元获取内容信息和相关信息,如果不大于,通知结果返回单元将所述多条搜索结果返回给客户端;
结果返回单元,用于将所述多条搜索结果返回给客户端。
CN201710103636.2A 2017-02-24 2017-02-24 一种信息搜索方法及装置 Active CN108304421B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710103636.2A CN108304421B (zh) 2017-02-24 2017-02-24 一种信息搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710103636.2A CN108304421B (zh) 2017-02-24 2017-02-24 一种信息搜索方法及装置

Publications (2)

Publication Number Publication Date
CN108304421A true CN108304421A (zh) 2018-07-20
CN108304421B CN108304421B (zh) 2021-03-23

Family

ID=62872517

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710103636.2A Active CN108304421B (zh) 2017-02-24 2017-02-24 一种信息搜索方法及装置

Country Status (1)

Country Link
CN (1) CN108304421B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109436834A (zh) * 2018-09-25 2019-03-08 北京金茂绿建科技有限公司 一种选取漏斗的方法及装置
CN113343131A (zh) * 2021-06-30 2021-09-03 北京三快在线科技有限公司 一种模型训练的方法、信息展示的方法及装置
CN113656574A (zh) * 2021-10-19 2021-11-16 北京欧应信息技术有限公司 用于搜索结果排序的方法、计算设备和存储介质
CN113886685A (zh) * 2021-09-23 2022-01-04 北京三快在线科技有限公司 一种搜索方法、装置、存储介质及电子设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101233513A (zh) * 2005-07-29 2008-07-30 雅虎公司 对结果集进行重排序的系统和方法
US7693833B2 (en) * 2007-02-01 2010-04-06 John Nagle System and method for improving integrity of internet search
CN101763391A (zh) * 2008-12-23 2010-06-30 康佳集团股份有限公司 分布式网络站点及其信息搜索方法及系统
CN102339294A (zh) * 2010-07-27 2012-02-01 卓望数码技术(深圳)有限公司 一种对关键词进行预处理的搜索方法和系统
CN103176998A (zh) * 2011-12-21 2013-06-26 上海博路信息技术有限公司 一种基于语音识别的阅读辅助系统
CN103793418A (zh) * 2012-10-31 2014-05-14 珠海富讯网络科技有限公司 一种针对证券行业的实时垂直搜索引擎的搜索方法
CN104102721A (zh) * 2014-07-18 2014-10-15 百度在线网络技术(北京)有限公司 信息推荐方法和装置
CN106294765A (zh) * 2016-08-11 2017-01-04 乐视控股(北京)有限公司 处理新闻数据的方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101233513A (zh) * 2005-07-29 2008-07-30 雅虎公司 对结果集进行重排序的系统和方法
US7693833B2 (en) * 2007-02-01 2010-04-06 John Nagle System and method for improving integrity of internet search
CN101763391A (zh) * 2008-12-23 2010-06-30 康佳集团股份有限公司 分布式网络站点及其信息搜索方法及系统
CN102339294A (zh) * 2010-07-27 2012-02-01 卓望数码技术(深圳)有限公司 一种对关键词进行预处理的搜索方法和系统
CN103176998A (zh) * 2011-12-21 2013-06-26 上海博路信息技术有限公司 一种基于语音识别的阅读辅助系统
CN103793418A (zh) * 2012-10-31 2014-05-14 珠海富讯网络科技有限公司 一种针对证券行业的实时垂直搜索引擎的搜索方法
CN104102721A (zh) * 2014-07-18 2014-10-15 百度在线网络技术(北京)有限公司 信息推荐方法和装置
CN106294765A (zh) * 2016-08-11 2017-01-04 乐视控股(北京)有限公司 处理新闻数据的方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109436834A (zh) * 2018-09-25 2019-03-08 北京金茂绿建科技有限公司 一种选取漏斗的方法及装置
CN113343131A (zh) * 2021-06-30 2021-09-03 北京三快在线科技有限公司 一种模型训练的方法、信息展示的方法及装置
CN113886685A (zh) * 2021-09-23 2022-01-04 北京三快在线科技有限公司 一种搜索方法、装置、存储介质及电子设备
CN113886685B (zh) * 2021-09-23 2023-01-06 北京三快在线科技有限公司 一种搜索方法、装置、存储介质及电子设备
CN113656574A (zh) * 2021-10-19 2021-11-16 北京欧应信息技术有限公司 用于搜索结果排序的方法、计算设备和存储介质
CN113656574B (zh) * 2021-10-19 2022-02-08 北京欧应信息技术有限公司 用于搜索结果排序的方法、计算设备和存储介质

Also Published As

Publication number Publication date
CN108304421B (zh) 2021-03-23

Similar Documents

Publication Publication Date Title
US11580168B2 (en) Method and system for providing context based query suggestions
JP2019114286A (ja) リアルタイムの検索調整
US8392446B2 (en) System and method for providing vector terms related to a search query
JP5860456B2 (ja) 検索語重み付けの決定および利用
US7685200B2 (en) Ranking and suggesting candidate objects
US9069859B2 (en) Search query processing
AU2010253866B2 (en) Merging search results
US20080082486A1 (en) Platform for user discovery experience
US8086631B2 (en) Search result diversification
CN108304421A (zh) 一种信息搜索方法及装置
US20140172821A1 (en) Generating filters for refining search results
US20110191327A1 (en) Method for Human Ranking of Search Results
JP2014501422A (ja) ユーザ意図の有無に基づく検索キーワードの推薦
CN103678668A (zh) 相关搜索结果的提示方法、服务器及系统
CN110795627A (zh) 信息推荐方法及装置、电子设备
US20020133726A1 (en) Information retrieval support method and information retrieval support system
JP2011192102A (ja) サマリ作成装置、サマリ作成方法及びプログラム
US8484202B2 (en) Optimizing blending algorithms using interleaving
JP2016509703A (ja) ラベル付けされた主に非テキストのアイテムを検索するためのシステム及び方法
US9623119B1 (en) Accentuating search results
US11144559B2 (en) Customized search result ranking based on user groups
CN106528596A (zh) 一种信息推荐方法及装置
US20120310932A1 (en) Determining matching degrees between information categories and displayed information
JP7346818B2 (ja) 情報処理装置及びプログラム
WO2005024661A2 (en) Improved search engine optimisation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant