CN104881504A - 一种信息搜索方法及装置 - Google Patents

一种信息搜索方法及装置 Download PDF

Info

Publication number
CN104881504A
CN104881504A CN201510355682.2A CN201510355682A CN104881504A CN 104881504 A CN104881504 A CN 104881504A CN 201510355682 A CN201510355682 A CN 201510355682A CN 104881504 A CN104881504 A CN 104881504A
Authority
CN
China
Prior art keywords
keyword
search results
search
weight
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510355682.2A
Other languages
English (en)
Other versions
CN104881504B (zh
Inventor
王路
骆超锋
吕云毅
李国强
刘涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZHENGZHOU XIZHI INFORMATION TECHNOLOGY Co Ltd
Original Assignee
ZHENGZHOU XIZHI INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZHENGZHOU XIZHI INFORMATION TECHNOLOGY Co Ltd filed Critical ZHENGZHOU XIZHI INFORMATION TECHNOLOGY Co Ltd
Priority to CN201510355682.2A priority Critical patent/CN104881504B/zh
Publication of CN104881504A publication Critical patent/CN104881504A/zh
Application granted granted Critical
Publication of CN104881504B publication Critical patent/CN104881504B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种信息搜索方法及装置,其中第一关键词和至少一个第二关键词是对用户输入的搜索词根据词性定义进行分词得到,因此基于第一关键词和至少一个第二关键词搜索得到的至少一个搜索结果与用户输入的搜索词更加匹配。并且在得到搜索结果的第一排序后,若第一排序中任意一个第一关键词对应的多个搜索结果连续,则会更改多个搜索结果的排序以使多个搜索结果与其他搜索结果交叉排序,这样一个网页搜索界面中可以同时显示多个不同的搜索结果,尤其是对于产品来说可以在一个网页搜索界面中同时显示多个对应不同产品信息的搜索结果,这样用户可以在同一个网页搜索界面中查找到多个搜索结果,便于用户快速查找到所需的网络信息。

Description

一种信息搜索方法及装置
技术领域
本发明涉及网络信息技术领域,更具体地说,涉及一种信息搜索方法及装置。
背景技术
近年来,由于网络技术的蓬勃发展与网络频宽的大幅提升,移动终端可通过网络快速地连接上全世界各个角落的网络,以获取网络中提供的信息。正因如此,面对网络所提供的大量信息,如何查找到需要的网络信息为网络使用者的首要需求,搜索引擎即提供了网页帅选的服务,以为网络使用者提供其需要的网络信息。
一般而言,搜索引擎的运作方式可分为三类,包括全文搜索、目录搜索与集合式(META)搜索。其中,Google与Yahoo分别为全文搜索与目录搜索的代表。当使用者需要搜索网络信息时,可根据使用习惯将移动终端与一个搜索引擎取得连结,输入关键词后执行搜索功能,搜索引擎便会将搜索结果以网页形式呈现在使用者的移动终端上。
然而,尽管这些搜索引擎给用户提供了选择信息的便利,但是用户在进行信息选择的过程中,仍然需要花费大量的时间和精力进行信息选择,尤其是网络信息的庞大,给用户选择带来了困难。有鉴于此,有必要提供一种信息搜索方法,以便于用户可以快速查找到所需的网络信息。
发明内容
有鉴于此,本发明提供的目的一种信息搜索方法及装置,用于使用户可以快速查找到所需的网络信息。为了实现上述目的,本发明提供如下技术方案:
本发明提供一种信息搜索方法,包括:
对用户输入的搜索词根据词性定义进行分词,得到第一关键词和至少一个第二关键词,其中所述第一关键词用于指示所述搜索词的关键信息,所述至少一个第二关键词是根据词性定义对所述第一关键词进行限定的限定词;
基于所述第一关键词和所述至少一个第二关键词进行搜索,得到至少一个搜索结果;
基于至少一个第一权重参数,得到每个所述搜索结果的第一权重;
基于每个所述搜索结果的第一权重对搜索结果进行排序,得到所述搜索结果的第一排序;
当所述第一排序中任意一个所述第一关键词对应的多个搜索结果连续时,更改所述多个搜索结果的排序以使所述多个搜索结果与其他搜索结果交叉排序。
优选地,所述当所述第一排序中任意一个所述第一关键词对应的多个搜索结果连续时,更改所述多个搜索结果的排序,包括:
基于所述搜索结果的第一权重和调整参数,得到每个所述搜索结果的第二权重;
基于所述第二权重,得到所述搜索结果的第二排序,其中所述第二排序中任意一个所述第一关键词对应的多个搜索结果与其他搜索结果交叉排序。
优选地,基于所述第一关键词和所述至少一个第二关键词进行搜索,得到至少一个搜索结果,包括:
基于所述第一关键词进行搜索,得到与所述第一关键词匹配的产品信息;
基于所述第二关键词的词性对所述产品信息进行匹配,得到所述搜索结果。
优选地,所述基于至少一个第一权重参数,得到每个所述搜索结果的第一权重,包括:
基于第一关键词权重参数、第二关键词权重参数和信息搜索权重参数,计算每个搜索结果的第一权重。
优选地,所述信息搜索权重参数包括:成交次数、询价次数、咨询次数、用户总访问数量、网页总访问数量、单条产品评分、供应商评分和供应商权重。
本发明还提供一种信息搜索装置,包括:
分词单元,用于对用户输入的搜索词根据词性定义进行分词,得到第一关键词和至少一个第二关键词,其中所述第一关键词用于指示所述搜索词的关键信息,所述至少一个第二关键词是根据词性定义对所述第一关键词进行限定的限定词;
搜索单元,用于基于所述第一关键词和所述至少一个第二关键词进行搜索,得到至少一个搜索结果;
计算单元,用于基于至少一个第一权重参数,得到每个所述搜索结果的第一权重;
排序单元,用于基于每个所述搜索结果的第一权重对搜索结果进行排序,得到所述搜索结果的第一排序;
更改单元,用于当所述第一排序中任意一个所述第一关键词对应的多个搜索结果连续时,更改所述多个搜索结果的排序以使所述多个搜索结果与其他搜索结果交叉排序。
优选地,所述更改单元包括:
第一计算子单元,用于基于所述搜索结果的第一权重和调整参数,得到每个所述搜索结果的第二权重;
第二计算子单元,用于基于所述第二权重,得到所述搜索结果的第二排序,其中所述第二排序中任意一个所述第一关键词对应的多个搜索结果与其他搜索结果交叉排序。
优选地,所述搜索单元包括:
搜索子单元,用于基于所述第一关键词进行搜索,得到与所述第一关键词匹配的产品信息;
匹配子单元,用于基于所述第二关键词的词性对所述产品信息进行匹配,得到所述搜索结果。
优选地,所述计算单元用于:基于第一关键词权重参数、第二关键词权重参数和信息搜索权重参数,计算每个搜索结果的第一权重。
优选地,所述信息搜索权重参数包括:成交次数、询价次数、咨询次数、用户总访问数量、网页总访问数量、单条产品评分、供应商评分和供应商权重。
与现有技术相比,本发明的优点如下:
本发明提供的上述技术方案中,第一关键词和至少一个第二关键词是对用户输入的搜索词根据词性定义进行分词得到,因此基于第一关键词和至少一个第二关键词搜索得到的至少一个搜索结果与用户输入的搜索词更加匹配。并且在得到搜索结果的第一排序后,若第一排序中任意一个第一关键词对应的多个搜索结果连续,则会更改多个搜索结果的排序以使多个搜索结果与其他搜索结果交叉排序,这样一个网页搜索界面中可以同时显示多个不同的搜索结果,尤其是对于产品来说可以在一个网页搜索界面中同时显示多个对应不同产品信息的搜索结果,这样用户可以在同一个网页搜索界面中查找到多个搜索结果,便于用户快速查找到所需的网络信息。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的信息搜索方法的流程图;
图2为本发明实施例提供的信息搜索装置的结构示意图。
具体实施方式
发明人经过研究发现,目前网络搜索界面在展示网络信息时通常将相关联的网络显示连续展示,比如网络搜索界面在展示用户搜索的一个产品时,通常是将同一个供应商提供的多个相关联的产品信息展示在同一个网络搜索界面中,而用户通常的采购习惯是对比多个供应商提供的产品之后再决定采购哪个产品,因此这种将同一个供应商提供的多个相关联的产品信息展示在同一个网络搜索界面中使得用户不能及时查找到所需的网络信息。
为解决这一问题,本发明实施例提供一种信息搜索方法及装置,其可以将搜索结果打散,使得相关联的网络信息与其他网络信息交叉,例如将同一个供应商提供的多个相关联的产品信息与其他供应商提供的产品信息交叉,这样同一个网络搜索页面可以展示多种网络信息,便于用户快速查找到所需的网络信息。
为了使本领域技术人员更好地理解本发明实施例,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,其示出了本发明实施例提供的信息搜索方法的流程图,可以包括以下步骤:
101:对用户输入的搜索词根据词性定义进行分词,得到第一关键词和至少一个第二关键词,其中第一关键词用于指示搜索词的关键信息,至少一个第二关键词是根据词性定义对第一关键词进行限定的限定词。
也就是说本发明实施例在根据词性定义对搜索词进行分词后,可以得到指示搜索词的关键信息的第一关键词,以及得到对第一关键词进行限定的第二关键词。例如用户输入的搜索词为:“河南T001型破碎机”,根据词性定义分析可知:破碎机为搜索词中指示产品名称的词语,河南和T001则是对破碎机这一产品的限定,分别用于指示破碎机这一产品的地区名和类型名,因此根据词性定义可以将破碎机作为第一关键词,河南和T001则作为第二关键词。
再例如用户输入的搜索词为:“矿山用T002型破碎机”,根据词性定义分析可知:破碎机为搜索词中指示产品名称的词语,矿山和T002则是对破碎机这一产品的限定,分别用于指示破碎机这一产品应用领域和类型名,因此根据词性定义可以将破碎机作为第一关键词,矿山和T002则作为第二关键词。
假如用户输入的搜索词为“破碎机矿用河南”,根据词性定义分析可知:破碎机为搜索词中指示产品名称的词语,矿用和河南则是对破碎机这一产品的限定,分别用于指示破碎机这一产品应用领域和地区名,因此根据词性定义可以将破碎机作为第一关键词,矿用和河南则作为第二关键词。
从上述举例可知,目前用户输入的搜索词通常是产品的搜索词,对于这类搜索词通常可以将产品名称作为第一关键词,而其他对产品名称进行限定的词则可以作为第二关键词。发明人通过对多个产品的搜索词根据词性定义进行分析,得到第二关键词至少包括:公司名、地区名、品牌名和属性值,其中属性值包括:单店名、分类名和应用领域等对第一关键词进行限定的词。
在这里需要说明的一点是:第二关键词的个数根据用户输入的搜索词的而定,当用户输入的搜索词中仅包括一个对第一关键词进行限定的词,则第二关键词的个数为1;当用户输入的搜索词中包括多个对第一关键词进行限定的词,则第二关键词的个数为多个。
102:基于第一关键词和至少一个第二关键词进行搜索,得到至少一个搜索结果。可以理解的是:基于第一关键词和至少一个第二关键词,可以从现有一个搜索引擎提供的网络数据中得到至少一个搜索结果,得到的搜索结果的数量根据第一关键词、至少一个第二关键词和网络数据而定。
在本发明实施例中,基于第一关键词和至少一个第二关键词进行搜索的一种方式是:首先基于第一关键词进行搜索,得到与第一关键词匹配的产品信息;然后再基于第二关键词的词性对产品信息进行匹配,得到搜索结果。
也就是说,首先基于第一关键词得到与第一关键词匹配的产品信息,然后再对匹配到的产品信息按照词性定义进行分词,得到对产品信息中产品名称进行限定的其他词,将这些其他词与用于搜索的第二关键词进行一一匹配,得到最终的搜索结果。
以上述搜索词为“河南T001型破碎机”为例,其中第一关键词为破碎机,第二关键词为河南和T001,则以破碎机为基准首先进行搜索,得到搜索引擎提供的所有破碎机的产品信息,对所有破碎机的产品信息(即描述破碎机的产品介绍)按照词性定义进行分词,得到每个产品信息中对“破碎机”这一词进行限定的词,然后将每个产品信息中对“破碎机”这一词进行限定的词与用于搜索的第二关键词进行一一匹配,匹配一致的产品信息即是搜索结果。
在这里需要说明的一点是:当第二关键词的个数为多个时,可以从多个第二关键词中选取至少一个第二关键词进行搜索,当然也可以采用按照词性定义分词得到的全部第二关键词进行搜索。
103:基于至少一个第一权重参数,得到每个搜索结果的第一权重。其中第一权重用于指示任意一个搜索结果在所有搜索结果中的重要程度,即通过第一权重可以得知搜索结果被实际访问的情况。
在本发明实施例中,为得到较为准确的第一权重,可以考虑不同第一权重参数对第一权重的影响。例如可以基于第一关键词权重参数、第二关键词权重参数和信息搜索权重参数,计算每个搜索结果的第一权重。具体可以是:第一权重E=A×X%+B×Y%+C×Z%,A为第一关键词权重参数,B为第二关键词权重参数,C为信息搜索权重参数,X%、Y%和Z%分别是这三个参数的权重。
又因为第二关键词权重参数和信息搜索权重参数可以包括多个参数,所以第一权重E的计算公式可以更改为:
E=A×X%+(B1×Y1%+B2×Y2%+...+Bi×Yi%)+
(C1×Z1%+C2×Z2%+...+Cj×Zj%)
其中Bi为第i个第二关键词权重参数,Yi%为第i个第二关键词权重参数的权重,Cj为第j个信息搜索权重参数,Zj%为第j个信息搜索权重参数的权重。在本发明实施例中信息搜索权重参数包括:成交次数、询价次数、咨询次数、用户总访问数量、网页总访问数量、单条产品评分、供应商评分和供应商权重。
在本发明实施例中,信息搜索权重参数是针对每个搜索结果来说,其中成交次数用于指示搜索结果对应的产品实际成功交易次数,询价次数用于指示搜索结果对应的产品被询问价格的次数,咨询次数则用于指示搜索结果对应的产品被咨询的次数,其中咨询包括咨询价格,因此咨询次数大于或等于询价次数。
用户总访问数量用于指示搜索结果对应的产品被多少用户访问,网页总访问数量则用于指示搜索结果对应的产品被浏览的总次数,单条产品评分用于指示产品的质量情况,供应商评分和供应商权重则用于指示提供产品的供应商的信用情况。
从上述对信息搜索权重参数的介绍可知,本发明实施例在得到每个搜索结果的第一权重时,考虑不同因素对每个搜索结果的影响,因此基于不同因素得到的第一权重更加准确。
104:基于每个搜索结果的第一权重对搜索结果进行排序,得到搜索结果的第一排序。
105:当第一排序中任意一个第一关键词对应的多个搜索结果连续时,更改多个搜索结果的排序以使多个搜索结果与其他搜索结果交叉排序。
当第一排序中任意一个第一关键词对应的多个搜索结果连续时,表明有相关联的网络信息,如同一个供应商提供的多个相关联的产品信息展示在同一个网络搜索界面中,因此为将不关联的网络信息交叉展示则需要打乱连续的第一关键词对应的多个搜索结果,即更改这些连续的第一关键词对应的多个搜索结果。
在本发明实施例中,更改多个搜索结果的排序的一种方式是:基于搜索结果的第一权重和调整参数,得到每个搜索结果的第二权重。基于第二权重,得到搜索结果的第二排序。其中调整参数为预设的用于更改搜索结果排序的一个参数,其可以与产品出现次数相结合来调整第一权重,具体可以为:
第二权重yw=(xw+tc)/bc,xw为第一权重、tc为调整参数、bc为产品出现次数,通过这种调整可以使得第二排序中任意一个第一关键词对应的多个搜索结果与其他搜索结果交叉排序,这样在同一个网络搜索界面中可以同时展示不同供应商提供的产品信息,便于用户查找。
在这里需要说明的一点是:当第一排序中不存在第一关键词对应的多个搜索结果连续时,表明第一排序中各个相关联的网络信息同时展示在一个网络搜索界面的几率较小,此时可以不对搜索结果的排序进行更改,直接基于第一排序展示搜索结果即可。
从上述技术方案可知,本发明实施例提供的信息搜索方法中第一关键词和至少一个第二关键词是对用户输入的搜索词根据词性定义进行分词得到,因此基于第一关键词和至少一个第二关键词搜索得到的至少一个搜索结果与用户输入的搜索词更加匹配。并且在得到搜索结果的第一排序后,若第一排序中任意一个第一关键词对应的多个搜索结果连续,则会更改多个搜索结果的排序以使多个搜索结果与其他搜索结果交叉排序,这样一个网页搜索界面中可以同时显示多个不同的搜索结果,尤其是对于产品来说可以在一个网页搜索界面中同时显示多个对应不同产品信息的搜索结果,这样用户可以在同一个网页搜索界面中查找到多个搜索结果,便于用户快速查找到所需的网络信息。
与上述方法实施例相对应,本发明还提供一种信息搜索装置,其结构示意图如图2所示,可以包括:分词单元11、搜索单元12、计算单元13、排序单元14和更改单元15。
分词单元11,用于对用户输入的搜索词根据词性定义进行分词,得到第一关键词和至少一个第二关键词,其中第一关键词用于指示搜索词的关键信息,至少一个第二关键词是根据词性定义对第一关键词进行限定的限定词。
也就是说本发明实施例在根据词性定义对搜索词进行分词后,可以得到指示搜索词的关键信息的第一关键词,以及得到对第一关键词进行限定的第二关键词。例如用户输入的搜索词为:“河南T001型破碎机”,根据词性定义分析可知:破碎机为搜索词中指示产品名称的词语,河南和T001则是对破碎机这一产品的限定,分别用于指示破碎机这一产品的地区名和类型名,因此根据词性定义可以将破碎机作为第一关键词,河南和T001则作为第二关键词。
再例如用户输入的搜索词为:“矿山用T002型破碎机”,根据词性定义分析可知:破碎机为搜索词中指示产品名称的词语,矿山和T002则是对破碎机这一产品的限定,分别用于指示破碎机这一产品应用领域和类型名,因此根据词性定义可以将破碎机作为第一关键词,矿山和T002则作为第二关键词。
假如用户输入的搜索词为“破碎机矿用河南”,根据词性定义分析可知:破碎机为搜索词中指示产品名称的词语,矿用和河南则是对破碎机这一产品的限定,分别用于指示破碎机这一产品应用领域和地区名,因此根据词性定义可以将破碎机作为第一关键词,矿用和河南则作为第二关键词。
从上述举例可知,目前用户输入的搜索词通常是产品的搜索词,对于这类搜索词通常可以将产品名称作为第一关键词,而其他对产品名称进行限定的词则可以作为第二关键词。发明人通过对多个产品的搜索词根据词性定义进行分析,得到第二关键词至少包括:公司名、地区名、品牌名和属性值,其中属性值包括:单店名、分类名和应用领域等对第一关键词进行限定的词。
在这里需要说明的一点是:第二关键词的个数根据用户输入的搜索词的而定,当用户输入的搜索词中仅包括一个对第一关键词进行限定的词,则第二关键词的个数为1;当用户输入的搜索词中包括多个对第一关键词进行限定的词,则第二关键词的个数为多个。
搜索单元12,用于基于第一关键词和至少一个第二关键词进行搜索,得到至少一个搜索结果。搜索单元12在进行搜索时,可以首先由搜索单元12中的搜索子单元基于第一关键词进行搜索,得到与第一关键词匹配的产品信息;再触发搜索单元12中的匹配子单元基于第二关键词的词性对产品信息进行匹配,得到搜索结果。
也就是说,首先基于第一关键词得到与第一关键词匹配的产品信息,然后再对匹配到的产品信息按照词性定义进行分词,得到对产品信息中产品名称进行限定的其他词,将这些其他词与用于搜索的第二关键词进行一一匹配,得到最终的搜索结果。
以上述搜索词为“河南T001型破碎机”为例,其中第一关键词为破碎机,第二关键词为河南和T001,则以破碎机为基准首先进行搜索,得到搜索引擎提供的所有破碎机的产品信息,对所有破碎机的产品信息(即描述破碎机的产品介绍)按照词性定义进行分词,得到每个产品信息中对“破碎机”这一词进行限定的词,然后将每个产品信息中对“破碎机”这一词进行限定的词与用于搜索的第二关键词进行一一匹配,匹配一致的产品信息即是搜索结果。
在这里需要说明的一点是:当第二关键词的个数为多个时,可以从多个第二关键词中选取至少一个第二关键词进行搜索,当然也可以采用按照词性定义分词得到的全部第二关键词进行搜索。
计算单元13,用于基于至少一个第一权重参数,得到每个搜索结果的第一权重;其中第一权重用于指示任意一个搜索结果在所有搜索结果中的重要程度,即通过第一权重可以得知搜索结果被实际访问的情况。
在本发明实施例中,为得到较为准确的第一权重,可以考虑不同第一权重参数对第一权重的影响。例如计算单元13可以基于第一关键词权重参数、第二关键词权重参数和信息搜索权重参数,计算每个搜索结果的第一权重。具体可以是:第一权重E=A×X%+B×Y%+C×Z%,A为第一关键词权重参数,B为第二关键词权重参数,C为信息搜索权重参数,X%、Y%和Z%分别是这三个参数的权重。
又因为第二关键词权重参数和信息搜索权重参数可以包括多个参数,所以第一权重E的计算公式可以更改为:
E=A×X%+(B1×Y1%+B2×Y2%+...+Bi×Yi%)+
(C1×Z1%+C2×Z2%+...+Cj×Zj%)
其中Bi为第i个第二关键词权重参数,Yi%为第i个第二关键词权重参数的权重,Cj为第j个信息搜索权重参数,Zj%为第j个信息搜索权重参数的权重。在本发明实施例中信息搜索权重参数包括:成交次数、询价次数、咨询次数、用户总访问数量、网页总访问数量、单条产品评分、供应商评分和供应商权重。
在本发明实施例中,信息搜索权重参数是针对每个搜索结果来说,其中成交次数用于指示搜索结果对应的产品实际成功交易次数,询价次数用于指示搜索结果对应的产品被询问价格的次数,咨询次数则用于指示搜索结果对应的产品被咨询的次数,其中咨询包括咨询价格,因此咨询次数大于或等于询价次数。
用户总访问数量用于指示搜索结果对应的产品被多少用户访问,网页总访问数量则用于指示搜索结果对应的产品被浏览的总次数,单条产品评分用于指示产品的质量情况,供应商评分和供应商权重则用于指示提供产品的供应商的信用情况。
从上述对信息搜索权重参数的介绍可知,本发明实施例在得到每个搜索结果的第一权重时,考虑不同因素对每个搜索结果的影响,因此基于不同因素得到的第一权重更加准确。
排序单元14,用于基于每个搜索结果的第一权重对搜索结果进行排序,得到搜索结果的第一排序。
更改单元15,用于当第一排序中任意一个第一关键词对应的多个搜索结果连续时,更改多个搜索结果的排序以使多个搜索结果与其他搜索结果交叉排序。
当第一排序中任意一个第一关键词对应的多个搜索结果连续时,表明有相关联的网络信息,如同一个供应商提供的多个相关联的产品信息展示在同一个网络搜索界面中,因此为将不关联的网络信息交叉展示则需要打乱连续的第一关键词对应的多个搜索结果,即更改这些连续的第一关键词对应的多个搜索结果。
在本发明实施例中,更改多个搜索结果的排序的一种方式是:更改单元15中的第一计算子单元基于搜索结果的第一权重和调整参数,得到每个搜索结果的第二权重。再由更改单元15中的第二计算子单元基于第二权重,得到搜索结果的第二排序。其中调整参数为预设的用于更改搜索结果排序的一个参数,其可以与产品出现次数相结合来调整第一权重,具体可以为:
第二权重yw=(xw+tc)/bc,xw为第一权重、tc为调整参数、bc为产品出现次数,通过这种调整可以使得第二排序中任意一个第一关键词对应的多个搜索结果与其他搜索结果交叉排序,这样在同一个网络搜索界面中可以同时展示不同供应商提供的产品信息,便于用户查找。
在这里需要说明的一点是:当第一排序中不存在第一关键词对应的多个搜索结果连续时,表明第一排序中各个相关联的网络信息同时展示在一个网络搜索界面的几率较小,此时可以不对搜索结果的排序进行更改,直接基于第一排序展示搜索结果即可。
从上述技术方案可知,本发明实施例提供的信息搜索装置中第一关键词和至少一个第二关键词是对用户输入的搜索词根据词性定义进行分词得到,因此基于第一关键词和至少一个第二关键词搜索得到的至少一个搜索结果与用户输入的搜索词更加匹配。并且在得到搜索结果的第一排序后,若第一排序中任意一个第一关键词对应的多个搜索结果连续,则会更改多个搜索结果的排序以使多个搜索结果与其他搜索结果交叉排序,这样一个网页搜索界面中可以同时显示多个不同的搜索结果,尤其是对于产品来说可以在一个网页搜索界面中同时显示多个对应不同产品信息的搜索结果,这样用户可以在同一个网页搜索界面中查找到多个搜索结果,便于用户快速查找到所需的网络信息。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种信息搜索方法,其特征在于,包括:
对用户输入的搜索词根据词性定义进行分词,得到第一关键词和至少一个第二关键词,其中所述第一关键词用于指示所述搜索词的关键信息,所述至少一个第二关键词是根据词性定义对所述第一关键词进行限定的限定词;
基于所述第一关键词和所述至少一个第二关键词进行搜索,得到至少一个搜索结果;
基于至少一个第一权重参数,得到每个所述搜索结果的第一权重;
基于每个所述搜索结果的第一权重对搜索结果进行排序,得到所述搜索结果的第一排序;
当所述第一排序中任意一个所述第一关键词对应的多个搜索结果连续时,更改所述多个搜索结果的排序以使所述多个搜索结果与其他搜索结果交叉排序。
2.根据权利要求1所述的方法,其特征在于,所述当所述第一排序中任意一个所述第一关键词对应的多个搜索结果连续时,更改所述多个搜索结果的排序,包括:
基于所述搜索结果的第一权重和调整参数,得到每个所述搜索结果的第二权重;
基于所述第二权重,得到所述搜索结果的第二排序,其中所述第二排序中任意一个所述第一关键词对应的多个搜索结果与其他搜索结果交叉排序。
3.根据权利要求2所述的方法,其特征在于,基于所述第一关键词和所述至少一个第二关键词进行搜索,得到至少一个搜索结果,包括:
基于所述第一关键词进行搜索,得到与所述第一关键词匹配的产品信息;
基于所述第二关键词的词性对所述产品信息进行匹配,得到所述搜索结果。
4.根据权利要求3所述的方法,其特征在于,所述基于至少一个第一权重参数,得到每个所述搜索结果的第一权重,包括:
基于第一关键词权重参数、第二关键词权重参数和信息搜索权重参数,计算每个搜索结果的第一权重。
5.根据权利要求4所述的方法,其特征在于,所述信息搜索权重参数包括:成交次数、询价次数、咨询次数、用户总访问数量、网页总访问数量、单条产品评分、供应商评分和供应商权重。
6.一种信息搜索装置,其特征在于,包括:
分词单元,用于对用户输入的搜索词根据词性定义进行分词,得到第一关键词和至少一个第二关键词,其中所述第一关键词用于指示所述搜索词的关键信息,所述至少一个第二关键词是根据词性定义对所述第一关键词进行限定的限定词;
搜索单元,用于基于所述第一关键词和所述至少一个第二关键词进行搜索,得到至少一个搜索结果;
计算单元,用于基于至少一个第一权重参数,得到每个所述搜索结果的第一权重;
排序单元,用于基于每个所述搜索结果的第一权重对搜索结果进行排序,得到所述搜索结果的第一排序;
更改单元,用于当所述第一排序中任意一个所述第一关键词对应的多个搜索结果连续时,更改所述多个搜索结果的排序以使所述多个搜索结果与其他搜索结果交叉排序。
7.根据权利要求6所述的装置,其特征在于,所述更改单元包括:
第一计算子单元,用于基于所述搜索结果的第一权重和调整参数,得到每个所述搜索结果的第二权重;
第二计算子单元,用于基于所述第二权重,得到所述搜索结果的第二排序,其中所述第二排序中任意一个所述第一关键词对应的多个搜索结果与其他搜索结果交叉排序。
8.根据权利要求7所述的装置,其特征在于,所述搜索单元包括:
搜索子单元,用于基于所述第一关键词进行搜索,得到与所述第一关键词匹配的产品信息;
匹配子单元,用于基于所述第二关键词的词性对所述产品信息进行匹配,得到所述搜索结果。
9.根据权利要求8所述的装置,其特征在于,所述计算单元用于:基于第一关键词权重参数、第二关键词权重参数和信息搜索权重参数,计算每个搜索结果的第一权重。
10.根据权利要求9所述的装置,其特征在于,所述信息搜索权重参数包括:成交次数、询价次数、咨询次数、用户总访问数量、网页总访问数量、单条产品评分、供应商评分和供应商权重。
CN201510355682.2A 2015-06-23 2015-06-23 一种信息搜索方法及装置 Active CN104881504B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510355682.2A CN104881504B (zh) 2015-06-23 2015-06-23 一种信息搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510355682.2A CN104881504B (zh) 2015-06-23 2015-06-23 一种信息搜索方法及装置

Publications (2)

Publication Number Publication Date
CN104881504A true CN104881504A (zh) 2015-09-02
CN104881504B CN104881504B (zh) 2018-08-14

Family

ID=53948997

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510355682.2A Active CN104881504B (zh) 2015-06-23 2015-06-23 一种信息搜索方法及装置

Country Status (1)

Country Link
CN (1) CN104881504B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930376A (zh) * 2016-04-12 2016-09-07 广东欧珀移动通信有限公司 一种搜索方法和装置
CN106250530A (zh) * 2016-08-06 2016-12-21 马岩 大数据中关键字分类搜索方法及系统
CN106462645A (zh) * 2016-01-07 2017-02-22 马岩 网络信息的搜索方法及系统
WO2018027341A1 (zh) * 2016-08-06 2018-02-15 马岩 大数据中关键字分类搜索方法及系统
CN108121754A (zh) * 2016-11-30 2018-06-05 北京国双科技有限公司 一种获取关键词属性组合的方法及装置
WO2019041195A1 (zh) * 2017-08-30 2019-03-07 深圳市云中飞网络科技有限公司 应用资源处理方法及相关产品
CN109992603A (zh) * 2019-04-04 2019-07-09 北京金堤科技有限公司 一种数据搜索方法、装置、电子设备和计算机可读介质
CN110287307A (zh) * 2019-05-05 2019-09-27 浙江吉利控股集团有限公司 一种搜索结果排序方法、装置及服务器

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101158971A (zh) * 2007-11-15 2008-04-09 深圳市迅雷网络技术有限公司 一种基于搜索引擎的搜索结果排序方法及装置
US20090112855A1 (en) * 2007-10-30 2009-04-30 International Business Machines Corporation Method for ordering a search result and an ordering apparatus
CN102193999A (zh) * 2011-05-09 2011-09-21 北京百度网讯科技有限公司 一种对搜索结果进行排序的方法及设备
CN103207904A (zh) * 2013-03-28 2013-07-17 百度在线网络技术(北京)有限公司 搜索结果的提供方法及搜索引擎
CN103970761A (zh) * 2013-01-28 2014-08-06 阿里巴巴集团控股有限公司 一种商品数据搜索方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090112855A1 (en) * 2007-10-30 2009-04-30 International Business Machines Corporation Method for ordering a search result and an ordering apparatus
CN101158971A (zh) * 2007-11-15 2008-04-09 深圳市迅雷网络技术有限公司 一种基于搜索引擎的搜索结果排序方法及装置
CN102193999A (zh) * 2011-05-09 2011-09-21 北京百度网讯科技有限公司 一种对搜索结果进行排序的方法及设备
CN103970761A (zh) * 2013-01-28 2014-08-06 阿里巴巴集团控股有限公司 一种商品数据搜索方法及装置
CN103207904A (zh) * 2013-03-28 2013-07-17 百度在线网络技术(北京)有限公司 搜索结果的提供方法及搜索引擎

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106462645A (zh) * 2016-01-07 2017-02-22 马岩 网络信息的搜索方法及系统
WO2017117783A1 (zh) * 2016-01-07 2017-07-13 马岩 网络信息的搜索方法及系统
CN105930376A (zh) * 2016-04-12 2016-09-07 广东欧珀移动通信有限公司 一种搜索方法和装置
CN105930376B (zh) * 2016-04-12 2019-08-02 Oppo广东移动通信有限公司 一种搜索方法和装置
CN106250530A (zh) * 2016-08-06 2016-12-21 马岩 大数据中关键字分类搜索方法及系统
WO2018027341A1 (zh) * 2016-08-06 2018-02-15 马岩 大数据中关键字分类搜索方法及系统
CN108121754A (zh) * 2016-11-30 2018-06-05 北京国双科技有限公司 一种获取关键词属性组合的方法及装置
WO2019041195A1 (zh) * 2017-08-30 2019-03-07 深圳市云中飞网络科技有限公司 应用资源处理方法及相关产品
CN109992603A (zh) * 2019-04-04 2019-07-09 北京金堤科技有限公司 一种数据搜索方法、装置、电子设备和计算机可读介质
CN110287307A (zh) * 2019-05-05 2019-09-27 浙江吉利控股集团有限公司 一种搜索结果排序方法、装置及服务器

Also Published As

Publication number Publication date
CN104881504B (zh) 2018-08-14

Similar Documents

Publication Publication Date Title
CN104881504A (zh) 一种信息搜索方法及装置
CN103092856B (zh) 搜索结果排序方法及设备、搜索方法及设备
US10606897B2 (en) Aggregating personalized suggestions from multiple sources
US20160210352A1 (en) Information search method and system
US8918408B2 (en) Candidate generation for predictive input using input history
US20150120451A1 (en) Method and apparatus for acquiring merchant information
CN103365904B (zh) 一种广告信息搜索方法和系统
JP5575270B2 (ja) オンライン商取引プラットフォームにおける広告ソースおよびキーワードセットの適合
CN104933149A (zh) 一种信息搜索方法及装置
CN104077407A (zh) 一种智能数据搜索系统及方法
CN102929987A (zh) 一种基于标识组合的搜索方法及装置
CN108920665A (zh) 基于网络结构和评论文本的推荐评分方法及装置
CN105630827A (zh) 一种信息处理方法、系统及辅助系统
CN103136213A (zh) 一种提供相关词的方法及装置
CN104915860A (zh) 一种商品推荐方法及装置
CN103049444A (zh) 一种数据信息分类结构的存储方法和系统
CN103942319A (zh) 一种搜索的方法及装置
CN104503991A (zh) 一种信息搜索方法和装置
CN109657145A (zh) 商户搜索方法及装置、电子设备及计算机可读存储介质
CN113190741A (zh) 搜索方法、装置、电子设备及存储介质
CN116204672A (zh) 图像识别、模型训练方法、装置、设备及存储介质
CN114595272A (zh) 获取推荐图表类型的方法及装置、电子设备、存储介质
CN103164436A (zh) 一种图像搜索方法及装置
CN104991915A (zh) 一种信息搜索方法及装置
CN105045835A (zh) 信息搜索方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 450000 Zhengzhou science and technology zone, Henan high tech Road, building 169, building 1, No. 1

Applicant after: ZHENGZHOU XIZHI INFORMATION TECHNOLOGY CO., LTD.

Address before: 450000 Zhengzhou science and technology zone, Henan high tech Road, building 169, building 1, No. 1

Applicant before: ZHENGZHOU XIZHI INFORMATION TECHNOLOGY CO., LTD.

COR Change of bibliographic data
GR01 Patent grant
GR01 Patent grant