CN108073664B - 一种信息处理方法、装置、设备及客户端设备 - Google Patents

一种信息处理方法、装置、设备及客户端设备 Download PDF

Info

Publication number
CN108073664B
CN108073664B CN201611042822.1A CN201611042822A CN108073664B CN 108073664 B CN108073664 B CN 108073664B CN 201611042822 A CN201611042822 A CN 201611042822A CN 108073664 B CN108073664 B CN 108073664B
Authority
CN
China
Prior art keywords
search
type
character string
feature data
search result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611042822.1A
Other languages
English (en)
Other versions
CN108073664A (zh
Inventor
林建素
刘方
闫晓丹
刘峻溢
黄健帮
张晓尨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201611042822.1A priority Critical patent/CN108073664B/zh
Publication of CN108073664A publication Critical patent/CN108073664A/zh
Application granted granted Critical
Publication of CN108073664B publication Critical patent/CN108073664B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

本发明涉及通信领域,公开了一种信息处理方法、装置、设备及客户端设备,以解决现有技术中网络搜索时所提供的搜索结果不够准确的技术问题。该方法包括:通过搜索字符串在预设网站搜索获得基础数据;从所述基础数据中确定出与所述搜索字符串关联的至少一个特征数据;分别确定出与每个所述特征数据匹配的第一类搜索结果;依据所述至少一个特征数据对应的第一类搜索结果,生成所述搜索字符串对应的第二类搜索结果。达到了为搜索关键词提供了更加准确的搜索结果的技术效果。

Description

一种信息处理方法、装置、设备及客户端设备
技术领域
本发明涉及通信领域,尤其涉及一种信息处理方法、装置、设备及客户端设备。
背景技术
随着科学技术的不断发展,电子技术也得到了飞速的发展,电子产品的种类也越来越多,人们也享受到了科技发展带来的各种便利。现在人们可以通过各种类型的客户端设备,享受随着科技发展带来的舒适生活。例如,笔记本电脑、台式电脑、智能手机、平板电脑等客户端设备已经成为人们生活中一个重要的组成部分。
通常情况下,电子设备都具备搜索功能,可以通过搜索关键词在网络中搜索获得相关的搜索结果,现有技术中往往是将各条搜索结果通过一定规则排序之后提供给用户,其存在着所提供的搜索结果不够精确的技术问题。
发明内容
本发明提供一种信息处理方法、装置、设备及客户端设备,以解决现有技术中网络搜索时所提供的搜索结果不够准确的技术问题。
第一方面,本发明实施例提供一种信息处理方法,包括:通过搜索字符串在预设网站搜索获得基础数据;从所述基础数据中确定出与所述搜索字符串关联的至少一个特征数据;分别确定出与每个所述特征数据匹配的第一类搜索结果;依据所述至少一个特征数据对应的第一类搜索结果,生成所述搜索字符串对应的第二类搜索结果。
结合第一方面,在第一种可能的实现方式中,所述分别确定出与每个所述特征数据匹配的第一类搜索结果,包括:基于每个所述特征数据所在的基础数据确定每个所述特征数据匹配的第一类搜索结果;或者,将所述搜索字符串与每个特征数据分别组合为新的搜索关键词;通过所述新的搜索关键词在网络中搜索获得每个所述特征数据匹配的第一类搜索结果。
结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述从所述基础数据中确定出与所述搜索字符串关联的至少一个特征数据,包括:从所述基础数据中提取出与所述搜索字符串位于同一页面的至少一个关键词;从所述至少一个关键词中确定出出现次数满足第一预设条件的关联关键词;将所述出现次数满足第一预设条件的关联关键词作为所述特征数据。
结合第一方面的第二种可能的实现方式,在第三种可能的实现方式中,所述从所述至少一个关键词中确定出出现次数满足第一预设条件的关联关键词,包括:对所述至少一个关键词基于语义相关性进行归一化处理,获得归一化处理后的关键词;从所述归一化处理后的关键词中确定出出现次数满足所述第一预设条件的关联关键词。
结合第一方面,在第四种可能的实现方式中,在所述通过搜索字符串在预设网站搜索获得基础数据之前,所述方法还包括:从网络中获得网络提问信息;判断所述网络提问信息是否存在满足第二预设条件的答案;如果不存在,将所述网络提问信息作为所述搜索字符串,执行所述通过搜索字符串在预设网站搜索获得基础数据的步骤。
第二方面,本发明实施例提供一种信息处理方法,包括:接收用户通过预设搜索界面产生的包含搜索字符串的搜索请求;响应所述搜索请求,确定出与所述搜索字符串匹配的第二类搜索结果,所述第二类搜索结果中包含:与所述搜索字符串关联的至少一个特征数据以及每个特征数据分别对应的第一类搜索结果,所述特征数据基于通过所述搜索字符串搜索获得的基础数据确定;将所述第二类搜索结果作为与所述搜索字符串匹配的搜索结果项展示给所述用户。
结合第二方面,在第一种可能的实现方式中,所述确定出与所述搜索字符串匹配的第二类搜索结果,包括:在对应关系表中获取与所述搜索字符串匹配的预存字符串,将所述匹配的预存字符串对应的搜索结果作为与所述搜索字符串匹配的第二类搜索结果;或者,将所述搜索字符串发送至服务器,以使所述服务器基于所述搜索字符串返回与所述搜索字符串匹配的所述第二类搜索结果;其中,所述服务器在对应关系表中获取与所述搜索字符串匹配的预存字符串,将所述匹配的预存字符串对应的搜索结果作为与所述搜索字符串匹配的第二类搜索结果。
结合第二方面,在第二种可能的实现方式中,所述将所述第二类搜索结果作为与所述搜索字符串匹配的搜索结果项展示给所述用户,包括:将所述第二类搜索结果的显示区域划分为与所述特征数据对应数目的子区域;将每个所述特征数据对应的第一类搜索结果分别显示于所述显示区域的不同子区域中。
结合第二方面或第二方面的第一至二种可能的实现方式中的任意一种可能的实现方式,在第三种可能的实现方式中,在所述接收用户通过预设搜索界面产生的包含搜索字符串的搜索请求之后,所述响应所述搜索请求之前,所述方法还包括:从网络中获得与所述搜索字符串对应的网络提问信息;判断所述网络提问信息是否存在满足第二预设条件的答案;如果不存在,执行所述响应所述搜索请求的步骤。
第三方面,本发明实施例提供一种信息处理装置,包括:搜索模块,用于通过搜索字符串在预设网站搜索获得基础数据;第一确定模块,用于从所述基础数据中确定出与所述搜索字符串关联的至少一个特征数据;第二确定模块,用于分别确定出与每个所述特征数据匹配的第一类搜索结果;生成模块,用于依据所述至少一个特征数据对应的第一类搜索结果,生成所述搜索字符串对应的第二类搜索结果。
结合第三方面,在第一种可能的实现方式中,所述第二确定模块,用于:基于每个所述特征数据所在的基础数据确定每个所述特征数据匹配的第一类搜索结果;或者,将所述搜索字符串与每个特征数据分别组合为新的搜索关键词;通过所述新的搜索关键词在网络中搜索获得每个所述特征数据匹配的第一类搜索结果。
结合第三方面的第一种可能的实现方式,在第二种可能的实现方式中,所述第一确定模块,包括:提取单元,用于从所述基础数据中提取出与所述搜索字符串位于同一页面的至少一个关键词;第一确定单元,用于从所述至少一个关键词中确定出出现次数满足第一预设条件的关联关键词;第二确定单元,用于将所述出现次数满足第一预设条件的关联关键词作为所述特征数据。
结合第三方面的第二种可能的实现方式,在第三种可能的实现方式中,所述第一确定单元,包括:归一子单元,用于对所述至少一个关键词基于语义相关性进行归一化处理,获得归一化处理后的关键词;确定子单元,用于从所述归一化处理后的关键词中确定出出现次数满足所述第一预设条件的关联关键词。
结合第三方面,在第四种可能的实现方式中,所述装置还包括:第一获得模块,用于从网络中获得网络提问信息;第一判断模块,用于判断所述网络提问信息是否存在满足第二预设条件的答案;其中,如果所述第一判断模块的判断结果为否,将所述网络提问信息作为所述搜索字符串,通过所述搜索模块执行所述通过搜索字符串在预设网站搜索获得基础数据的步骤。
第四方面,本发明实施例提供一种信息处理装置,包括:接收模块,用于接收用户通过预设搜索界面产生的包含搜索字符串的搜索请求;响应模块,用于响应所述搜索请求,确定出与所述搜索字符串匹配的第二类搜索结果,所述第二类搜索结果中包含:与所述搜索字符串关联的至少一个特征数据以及每个特征数据分别对应的第一类搜索结果,所述特征数据基于通过所述搜索字符串搜索获得的基础数据确定;展示模块,用于将所述第二类搜索结果作为与所述搜索字符串匹配的搜索结果项展示给所述用户。
结合第四方面,在第一种可能的实现方式中,所述响应模块,用于:在对应关系表中获取与所述搜索字符串匹配的预存字符串,将所述匹配的预存字符串对应的搜索结果作为与所述搜索字符串匹配的第二类搜索结果;或者,将所述搜索字符串发送至服务器,以使所述服务器基于所述搜索字符串返回与所述搜索字符串匹配的所述第二类搜索结果;其中,所述服务器在对应关系表中获取与所述搜索字符串匹配的预存字符串,将所述匹配的预存字符串对应的搜索结果作为与所述搜索字符串匹配的第二类搜索结果。
结合第四方面的第一种可能的实现方式,在第二种可能的实现方式中,所述展示模块,包括:划分单元,用于将所述第二类搜索结果的显示区域划分为与所述特征数据对应数目的子区域;显示单元,用于将每个所述特征数据对应的第一类搜索结果分别显示于所述显示区域的不同子区域中。
结合第四方面或第四方面的第一至二种可能的实现方式中的任意一种可能的实现方式,在第三种可能的实现方式中,所述装置还包括:第二获得模块,用于从网络中获得与所述搜索字符串对应的网络提问信息;第二判断模块,用于判断所述网络提问信息是否存在满足第二预设条件的答案;其中,如果所述第二判断模块的判断结果为否,通过所述响应模块执行所述响应所述搜索请求的步骤。
第五方面,本发明实施例提供一种设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:通过搜索字符串在预设网站搜索获得基础数据;从所述基础数据中确定出与所述搜索字符串关联的至少一个特征数据;分别确定出与每个所述特征数据匹配的第一类搜索结果;依据所述至少一个特征数据对应的第一类搜索结果,生成所述搜索字符串对应的第二类搜索结果。
结合第五方面,在第一种可能的实现方式中,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:基于每个所述特征数据所在的基础数据确定每个所述特征数据匹配的第一类搜索结果;或者,将所述搜索字符串与每个特征数据分别组合为新的搜索关键词;通过所述新的搜索关键词在网络中搜索获得每个所述特征数据匹配的第一类搜索结果。
结合第五方面的第一种可能的实现方式,在第二种可能的实现方式中,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:从所述基础数据中提取出与所述搜索字符串位于同一页面的至少一个关键词;从所述至少一个关键词中确定出出现次数满足第一预设条件的关联关键词;将所述出现次数满足第一预设条件的关联关键词作为所述特征数据。
结合第五方面的第二种可能的实现方式,在第三种可能的实现方式中,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:对所述至少一个关键词基于语义相关性进行归一化处理,获得归一化处理后的关键词;从所述归一化处理后的关键词中确定出出现次数满足所述第一预设条件的关联关键词。
结合第五方面,在第四种可能的实现方式中,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:从网络中获得网络提问信息;判断所述网络提问信息是否存在满足第二预设条件的答案;如果不存在,将所述网络提问信息作为所述搜索字符串,执行所述通过搜索字符串在预设网站搜索获得基础数据的步骤。
第六方面,本发明实施例提供一种客户端设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:接收用户通过预设搜索界面产生的包含搜索字符串的搜索请求;响应所述搜索请求,确定出与所述搜索字符串匹配的第二类搜索结果,所述第二类搜索结果中包含:与所述搜索字符串关联的至少一个特征数据以及每个特征数据分别对应的第一类搜索结果,所述特征数据基于通过所述搜索字符串搜索获得的基础数据确定;将所述第二类搜索结果作为与所述搜索字符串匹配的搜索结果项展示给所述用户。
结合第六方面,在第一种可能的实现方式中,所述客户端设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:在对应关系表中获取与所述搜索字符串匹配的预存搜索字符串,将所述匹配的预存搜索字符串对应的搜索结果作为与所述搜索字符串匹配的第二类搜索结果;或者,将所述搜索字符串发送至服务器,以使所述服务器基于所述搜索字符串返回与所述搜索字符串匹配的所述第二类搜索结果;其中,所述服务器在对应关系表中获取与所述搜索字符串匹配的预存字符串,将所述匹配的预存字符串对应的搜索结果作为与所述搜索字符串匹配的第二类搜索结果。
结合第六方面,在第二种可能的实现方式中,所述客户端设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:将所述第二类搜索结果的显示区域划分为与所述特征数据对应数目的子区域;将每个所述特征数据对应的第一类搜索结果分别显示于所述显示区域的不同子区域中。
结合第六方面或第六方面的第一至二种可能的实现方式中的任意一种可能的实现方式,在第三种可能的实现方式中,所述客户端设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:从网络中获得与所述搜索字符串对应的网络提问信息;判断所述网络提问信息是否存在满足第二预设条件的答案;如果不存在,执行所述响应所述搜索请求的步骤。
本发明有益效果如下:
由于在本发明实施例中,在进行网络搜索时,可以通过搜索字符串在预设网站搜索获得基础数据;从所述基础数据中确定出与所述搜索字符串关联的至少一个特征数据;分别确定出与每个所述特征数据匹配的第一类搜索结果;依据所述至少一个特征数据对应的第一类搜索结果,生成所述搜索字符串对应的第二类搜索结果。也就是说,在提供通过搜索字符串进行搜索的搜索结果时,提供的是对应的搜索字符串的至少一个特征数据中的每类特征数据的搜索结果,其基于特征数据对各个搜索结果进行了区分,故而为搜索关键词提供了更加准确的搜索结果。
附图说明
图1示出了本发明实施例第一方面的信息处理方法的流程图;
图2示出了本发明实施例第二方面的信息处理方法的流程图;
图3示出了本发明实施例第三方面的信息处理装置的结构图;
图4示出了本发明实施例第四方面的信息处理装置的结构图;
图5示出了本发明实施例中实施信息处理方法的客户端设备的结构图;
图6示出了本发明实施例中实施信息处理方法的服务器的结构图。
具体实施方式
本发明提供一种信息处理方法、装置、设备及客户端设备,以解决现有技术中网络搜索时所提供的搜索结果不够准确的技术问题。
本申请实施例中的技术方案为解决上述的技术问题,总体思路如下:
在进行网络搜索时,可以通过搜索字符串在预设网站搜索获得基础数据;从所述基础数据中确定出与所述搜索字符串关联的至少一个特征数据;分别确定出与每个所述特征数据匹配的第一类搜索结果;依据所述至少一个特征数据对应的第一类搜索结果,生成所述搜索字符串对应的第二类搜索结果。也就是说,在提供通过搜索字符串进行搜索的搜索结果时,提供的是对应的搜索字符串的至少一个特征数据中的每类特征数据的搜索结果,其基于特征数据对各个搜索结果进行了区分,故而为搜索关键词提供了更加准确的搜索结果。
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本发明实施例以及实施例中的具体特征是对本发明技术方案的详细的说明,而不是对本发明技术方案的限定,在不冲突的情况下,本发明实施例以及实施例中的技术特征可以相互组合。
第一方面,本发明实施例提供一种信息处理方法,请参考图1,包括:
步骤S101:通过搜索字符串在预设网站搜索获得基础数据;
步骤S102:从所述基础数据中确定出与所述搜索字符串关联的至少一个特征数据;
步骤S103:分别确定出与每个所述特征数据匹配的第一类搜索结果;
步骤S104:依据所述至少一个特征数据对应的第一类搜索结果,生成所述搜索字符串对应的第二类搜索结果。
举例来说,该方案可以应用于客户端设备,该客户端设备例如为:手机、平板电脑、笔记本电脑、PC(Personal Computer:个人计算机)等等,在这种情况下,搜索字符串可以为客户端设备所接收到的用户输入的搜索字符串;该方案也可以应用于服务器,在这种情况下,该搜索字符串可以为客户端设备发送至的搜索字符串,也可以为服务器自身收集整理的搜索字符串等等,本发明实施例不作限制。
步骤S101中,该搜索字符串例如为:公交车上哪个位置的人会早下车、猫在想什么、怎么练就马甲线等等。该搜索字符串可以为用于搜索的任意字符串,作为一种可选的实施例,该搜索字符串可以为网络提问内容,该网络提问内容可以人工设定,也可以通过以下方式获得:从网络中获得网络提问信息;判断所述网络提问信息是否存在满足第二预设条件的答案;如果不存在,将所述网络提问信息作为所述搜索字符串,执行所述通过搜索字符串在预设网站搜索获得基础数据的步骤。
举例来说,网络中可能会存在很多用户产生的网络提问信息,则可以去网络提问网站获取网络提问信息,然后从这些网络提问信息中确定出不存在满足第二预设条件的答案的网络提问内容,作为后续步骤中所使用的搜索字符串。其中,该满足第二预设条件的答案例如为:被采纳的答案、被大于预设数量(例如:10、20等等)的用户所点赞的答案等等。如果针对某个网络提问信息不存在满足第二预设条件的答案,则说明针对该网络提问信息不存在让大部分人满意的答案,在这种情况下,将这些网络提问信息作为搜索字符串的话,可以基于后续操作,为这些网络提问信息提供满意的答案。
其中,预设网站可以为搜索引擎搜索时,所指定的所有网站,也可以为一些文章的质量较高的网站,例如:知乎、问问等等,进而通过该搜索字符串在这些网站进行挖掘,获得基础数据。
进一步的,本申请实施例还可以包括:在步骤S101之前,接收用户输入的搜索字符串,从网络中获取与所述搜索字符串对应的网络提问信息;判断所述网络提问信息是否存在满足第二预设条件的答案,如果否,则执行步骤S101。基于此,当用户输入的搜索字符串对应的网络提问信息不存在满足第二预设条件的答案时,说明网络中存在让用户满意的搜索结果的可能性较小,此时可以采用本申请实施例所述的方法为用户提供满意的搜索结果。
步骤S102中,可以通过多种方式确定出与所述搜索字符串关联的至少一个特征数据,下面列举其中的两种进行介绍,当然,在具体实施过程中,不限于以下两种情况。
第一种,所述从所述基础数据中确定出与所述搜索字符串关联的至少一个特征数据,包括:从所述基础数据中提取出与所述搜索字符串位于同一页面的至少一个关键词;从所述至少一个关键词中确定出出现次数满足第一预设条件的关联关键词;将所述出现次数满足第一预设条件的关联关键词作为所述特征数据。
举例来说,搜索字符串往往会与一些其他关键词关联存在,则可以提取出这些关联存在的关键词,然后从这些关联存在的关键词中获取出现次数满足第一预设条件的关键词,例如:出现次数大于预设次数(例如:20、30等等)的关键词、出现次数排序位于前预设位(例如:3、5等等)的关键词等等。
这些关联的关键词可以为多种关键词,例如:①针对搜索字符串所对应的问题的判断方式所对应的关键词,假设搜索字符串为“公交车上哪个位置的人会早下车”,则其可能会存在多种判断方式,例如:时间窗口、肢体语言、位置策略等等,则可以将这些判断方式分别作为特征数据;②该搜索字符串的应用环境,假设搜索字符串为“猫在想什么”,其会存在多种应用环境,例如:睡觉、发呆、盯着鱼缸中的鱼等等,则可以将这些应用环境作为特征数据等等;③该搜索字符串所对应的问题的实现方式,假设搜索字符串为“怎么练就马甲线”,其对应的实现方式可能包括:徒手深蹲、单脚直立支撑体前倾、徒手深蹲等等,则可以将这些实现方式作为其对应的特征数据。
在具体实施过程中,可以直接从提取出的至少一个关键词中获取出现次数满足第一预设条件的关联关键词。而作为一种可选的实施例,所述从所述至少一个关键词中确定出出现次数满足第一预设条件的关联关键词,包括:对所述至少一个关键词基于语义相关性进行归一化处理,获得归一化处理后的关键词;从所述归一化处理后的关键词中确定出出现次数满足所述第一预设条件的关联关键词。
举例来说,针对从基础数据中提取出的至少一个关键词,可以两两计算关键词的相似度值,如果其相似度值大于预设值,则可以对其进行归一化处理,也即是将其用一个关键词表示,例如:针对关键词“睡觉”、“困觉”、“睡眠”其相似度值往往较高,故而可以将其归一化为“睡觉”,针对关键词“锻炼”、“健身”、“美体”其相似度值往往也较高,故而可以将其归一化为“健身”等等,在对各个关键词进行归一化处理之后,再从中提取出满足第一预设条件的关联关键词。基于上述方案,针对语义相同的关键词,可能每个关键词的出现次数都不满足第一预设条件,但是将这些语义相同的关键词进行归一化处理后,得到的归一化后的关键词的出现次数可能满足第一预设条件,则可以将归一化的关键词提取为特征数据,故而到了所提取的特征数据更加精确的技术效果。
通过上述方案,能够从基于搜索关键词所搜索获得的基础数据中提取出至少一个特征数据,并最终提供给用户通过至少一个特征数据所获得第二类搜索结果,从而基于搜索关键词提供更加精确的搜索结果。
第二种,所述从所述基础数据中确定出与所述搜索字符串关联的至少一个特征数据,包括:从基础数据中提取出所述搜索字符串所在的句子;提取出搜索字符串所在句子包括的至少一个关键词;从提取出的至少一个关键词中确定出出现次数大于预设次数(例如:20、30等等)或者出现次数排序位于前预设位(例如:3、5等等)的关联关键词作为该搜索字符串的特征数据。
第三种,所述从所述基础数据中确定出与所述搜索字符串关联的至少一个特征数据,包括:对所述基础数据所包含的页面内容进行归纳总结,从而获得所述特征数据。举例来说,假设搜索字符串为“公交车上哪个位置的人会早下车”,其中多篇基础数据中都提及用户产生什么肢体动作时,表征用户即将下车,故而可以确定出其特征数据包括:肢体语言;又例如,假设搜索字符为:“怎么练就马甲线”,其中,多篇页面内容中都提取各种腹部锻炼(例如:卷腹、仰卧起坐等等),则可以确定出其对应的特征数据包括:腹部锻炼等等。在该方案中,特征数据并不一定都包含于基础数据中,而是可以基于基础数据总结获得,故而所确定的基础数据更加准确。该方法可以与第一种获得基础数据的方法结合使用,以便获取比较准确全面的基础数据。
步骤S103中,与特征数据所对应的第一类搜索结果例如包括:文字、网页、图片、视频等搜索结果中的一种或多种,如果特征数据为商品的话,则还可以提供该特征数据的相关购物网站的购物链接等等。
步骤S103中,可以通过多种方式确定出与每个所述特征数据匹配的第一类搜索结果,下面列举其中的两种进行介绍,当然,在具体实施过程中,不限于以下两种情况。
第一种,所述分别确定出与每个所述特征数据匹配的第一类搜索结果,包括:基于每个所述特征数据所在的基础数据确定对应该特征数据的第一类搜索结果。
举例来说,假设搜索字符串为“公交车上哪个位置的人会早下车”,其特征数据包括:时间窗口、肢体语言、位置策略,则可以从基础数据获取“时间窗口”所对应基础数据、“肢体语言”所对应的基础数据、“位置策略”所对应的基础数据,然后直接将其综合作为通过搜索字符串搜索所获得的第二类搜索结果。其中,如果某一类特征数据所对应的基础数据较多的话,则可以只选择该特征数据的部分基础数据(例如:显示2条、4条等等),如果用户选择该特征数据的话,则可以显示该特征数据下的其他基础数据。或者,针对每一类特征数据所对应的基础数据可以提取出其中的关键内容,并将该关键词内容作为该特征数据所对应的第一类搜索结果等等。
由于在上述方案中,在确定出搜索字符串所对应的特征数据之后,不需要基于特征数据进行重新搜索,故而达到了提高获得第一类搜索结果的效率的技术效果。
第二种,所述分别确定出与每个所述特征数据匹配的第一类搜索结果,包括:将所述搜索字符串与每个特征数据分别组合为新的搜索关键词;通过所述新的搜索关键词在网络中搜索获得每个所述特征数据匹配的第一类搜索结果。
举例来说,假设搜索字符串为“猫在想什么”,其特征数据包括:睡觉、发呆、盯着鱼缸中的鱼,则针对特征数据“睡觉”可以确定出搜索关键词包括:猫、睡觉、想什么,然后通过这三个关键词在网络中进行搜索,获得对应的搜索结果作为特征数据“睡觉”所对应的第一类搜索结果;针对其他特征数据获得其对应的第一类搜索结果的方式与之类似,在此不再赘述。
步骤S104中,在获得每个搜索字符串的特征数据以及特征数据下的第一类搜索结果时,可以将搜索字符串与特征数据以及特征数据下的第一类搜索结果关联,进而将该关联结果整体作为第二类搜索结果,例如表1所示:
表1
Figure BDA0001151164830000131
Figure BDA0001151164830000141
在具体实施过程中,基于该方案所应用在的设备不同,从而对获得的第二类搜索结果的处理方式也不同,下面列举其中的两种进行介绍,当然,在具体实施过程中,不限于以下两种情况。
第一种,所述方法应用于客户端设备,在这种情况下,还可以将第二类搜索结果作为一搜索结果项展示给用户,以方便用户通过搜索字符串获得更加精确的搜索结果。
举例来说,针对该搜索字符串存在几个特征数据,则可以将第二类搜索结果所在的搜索结果项划分为几个显示区域,然后将每个特征数据所对应的第一类搜索结果分别显示于不同的显示区域,例如:针对搜索字符串“猫在想什么”,则可以将第二类搜索结果所在的搜索结果项划分为三个显示区域,分别显示针对“猫在想什么+睡觉”、“猫在想什么+发呆”、“猫在想什么+盯着鱼缸中的鱼”分别对应的第一类搜索结果。例如,可以在该搜索结果项中以多个tab页的形式展示,即为设定该搜索结果项包括多个tab页,每个tab页显示一个特征数据对应的第一类搜索结果,用户可以通过切换tab页的形式查看各特征数据分别对应的第一类搜索结果。
在这种情况下,步骤S101所述获得搜索字符串,包括:获得所述客户端设备的用户通过预设搜索界面所产生的所述搜索字符串。
举例来说,该预设搜索界面例如为:网络提问界面、在网络搜索窗口所提供的一个特定的搜索界面等等。
第二种,所述方法应用于服务器,在所述依据所述至少一个特征数据对应的第一类搜索结果,生成所述搜索字符串对应的第二类搜索结果之后,所述方法还包括:建立每个搜索字符串与其对应的所述第二类搜索结果的对应关系。
举例来说,可以如表1所示,建立每个搜索字符串与其特征数据的关联关系,而每个特征数据又关联到其第一类搜索结果,从而建立每个搜索字符串与其第二类搜索结果的对应关系。
在这种情况下,作为一种可选的实施例,所述方法还包括:接收到客户端设备发送的包含搜索字符串的搜索请求;响应所述搜索请求,从所述对应关系中确定出与所述搜索字符串对应的第二类搜索结果;将与所述搜索字符串对应的第二类搜索结果提供给所述客户端设备。
举例来说,假设客户端设备的用户希望通过搜索字符串(例如:猫在想什么)进行搜索,则可以首先向客户端设备产生包含搜索字符串的搜索请求;客户端设备在接收到搜索请求之后,可以将其发送至服务器,服务器基于该搜索请求获得对应的第二类搜索结果,并将其发送至客户端设备,以使客户端设备实现通过搜索字符串进行更加精确搜索的发明目的。
第二方面,基于同一发明构思,本发明实施例提供一种信息处理方法,请参考图2,包括:
步骤S201:接收用户通过预设搜索界面产生的包含搜索字符串的搜索请求;
步骤S202:响应所述搜索请求,确定出与所述搜索字符串匹配的第二类搜索结果,所述第二类搜索结果中包含:与所述搜索字符串关联的至少一个特征数据以及每个特征数据分别对应的第一类搜索结果,所述特征数据基于通过所述搜索字符串搜索获得的基础数据确定;
步骤S203:将所述第二类搜索结果作为与所述搜索字符串匹配的搜索结果项展示给所述用户。
举例来说,该方案可以应用于客户端设备,该客户端设备例如为:手机、平板电脑、笔记本电脑、PC(Personal Computer:个人计算机)等等。
步骤S201中,该搜索字符串可以为任一字符串,作为一种可选的实施例,该搜索字符串为第一网络提问信息。作为一种可选的实施例,在所述接收用户通过预设搜索界面产生的包含搜索字符串的搜索请求之后,所述响应所述搜索请求之前,所述方法还包括:从网络中获得与所述搜索字符串对应的网络提问信息;判断所述网络提问信息是否存在满足第二预设条件的答案;如果不存在,执行所述响应所述搜索请求的步骤。当用户输入的搜索字符串对应的网络提问信息不存在满足第二预设条件的答案时,说明网络中存在让用户满意的搜索结果的可能性较小,此时可以采用本申请实施例所述的方法为用户提供满意的搜索结果。
步骤S202中,可以通过多种方式获得第二类搜索结果,下面列举其中的两种进行介绍,当然,在具体实施过程中,不限于以下两种情况。
第一种,所述确定出与所述搜索字符串对应的第二类搜索结果,包括:在对应关系表中获取与所述搜索字符串匹配的预存字符串,将所述匹配的预存字符串对应的搜索结果作为与所述搜索字符串匹配的第二类搜索结果。
举例来说,服务器在获得搜索字符串与第二类搜索结果的对应关系表之后,可以将其发送至各个客户端设备,从而客户端设备可以直接从本地获取与搜索字符串对应的第二类搜索结果,而不需要从服务器请求,达到了提高获得第二类搜索结果的效率的技术效果。其中,服务器可以每隔预设时间间隔(例如:1天、1周等等)就对各个客户端设备上的对应关系进行更新,以提高客户端设备所获得的第二类搜索结果的准确性。
第二种,所述确定出与所述搜索字符串对应的第二类搜索结果,包括:
将所述搜索字符串发送至服务器,以使所述服务器基于所述搜索字符串返回与所述搜索字符串匹配的所述第二类搜索结果;其中,所述服务器在对应关系表中获取与所述搜索字符串匹配的预存字符串,将所述匹配的预存字符串对应的搜索结果作为与所述搜索字符串匹配的第二类搜索结果。
步骤S203中,如果搜索字符串只包含一种特征数据的话,则可以将其显示于搜索结果项的显示区域即可,该搜索字符串也可以包含多种特征数据,在这种情况下,所述将所述第二类搜索结果作为与所述搜索字符串匹配的搜索结果项展示给所述用户,包括:将所述第二类搜索结果的显示区域划分为与所述特征数据对应数目的子区域;将每个所述特征数据对应的第一类搜索结果分别显示于所述显示区域的不同子区域中。
通过上述方案,能够基于获得第一类搜索结果的特征数据的不同,将其显示于不同的子区域,而不需要用户辨别,从而提高了对第二类搜索结果的阅读效率。
由于本发明实施例第二方面所介绍的信息处理方法与本发明实施例第一方面所介绍的信息处理方法对应,基于本发明实施例第一方面所介绍的信息处理方法,本领域所属技术人员能够了解本发明实施例第二方面所介绍的信息处理方法的具体实施方式及变形,故而在此不再赘述。
第三方面,基于同一发明构思,本发明实施例提供一种信息处理装置,请参考图3,包括:
搜索模块30,用于通过搜索字符串在预设网站搜索获得基础数据;
第一确定模块31,用于从所述基础数据中确定出与所述搜索字符串关联的至少一个特征数据;
第二确定模块32,用于分别确定出与每个所述特征数据匹配的第一类搜索结果;
生成模块33,用于依据所述至少一个特征数据对应的第一类搜索结果,生成所述搜索字符串对应的第二类搜索结果。
可选的,所述第二确定模块32,用于:
基于每个所述特征数据所在的基础数据确定每个所述特征数据匹配的第一类搜索结果;或者,
将所述搜索字符串与每个特征数据分别组合为新的搜索关键词;通过所述新的搜索关键词在网络中搜索获得每个所述特征数据匹配的第一类搜索结果。
可选的,所述第一确定模块31,包括:
提取单元,用于从所述基础数据中提取出与所述搜索字符串位于同一页面的至少一个关键词;
第一确定单元,用于从所述至少一个关键词中确定出出现次数满足第一预设条件的关联关键词;
第二确定单元,用于将所述出现次数满足第一预设条件的关联关键词作为所述特征数据。
可选的,所述第一确定单元,包括:
归一子单元,用于对所述至少一个关键词基于语义相关性进行归一化处理,获得归一化处理后的关键词;
确定子单元,用于从所述归一化处理后的关键词中确定出出现次数满足所述第一预设条件的关联关键词。
可选的,所述装置还包括:
第一获得模块,用于从网络中获得网络提问信息;
第一判断模块,用于判断所述网络提问信息是否存在满足第二预设条件的答案;
其中,如果所述第一判断模块的判断结果为否,将所述网络提问信息作为所述搜索字符串,通过所述搜索模块执行所述通过搜索字符串在预设网站搜索获得基础数据的步骤。
由于本发明第三方面所介绍的装置,为实施本发明实施例第一方面所介绍的信息处理方法所采用的装置,基于本发明实施例第一方面所介绍的信息处理方法,本领域所属技术人员能够了解本发明实施例第三方面所介绍的装置的具体结构及变形,故而在此不再赘述,凡是实施本发明实施例第一方面所介绍的信息处理方法所采用的装置都属于本发明所欲保护的范围。
第四方面,基于同一发明构思,本发明实施例提供一种信息处理装置,请参考图4,包括:
接收模块40,用于接收用户通过预设搜索界面产生的包含搜索字符串的搜索请求;
响应模块41,用于响应所述搜索请求,确定出与所述搜索字符串匹配的第二类搜索结果,所述第二类搜索结果中包含:与所述搜索字符串关联的至少一个特征数据以及每个特征数据分别对应的第一类搜索结果,所述特征数据基于通过所述搜索字符串搜索获得的基础数据确定;
展示模块42,用于将所述第二类搜索结果作为与所述搜索字符串匹配的搜索结果项展示给所述用户。
可选的,所述响应模块41,用于:
在对应关系表中获取与所述搜索字符串匹配的预存搜索字符串,将所述匹配的预存搜索字符串对应的搜索结果作为与所述搜索字符串匹配的第二类搜索结果;或者,
将所述搜索字符串发送至服务器,以使所述服务器基于所述搜索字符串返回与所述搜索字符串匹配的所述第二类搜索结果;其中,所述服务器在对应关系表中获取与所述搜索字符串匹配的预存字符串,将所述匹配的预存字符串对应的搜索结果作为与所述搜索字符串匹配的第二类搜索结果。
可选的,所述展示模块42,包括:
划分单元,用于将所述第二类搜索结果的显示区域划分为与所述特征数据对应数目的子区域;
显示单元,用于将每个所述特征数据对应的第一类搜索结果分别显示于所述显示区域的不同子区域中。
可选的,所述装置还包括:
第二获得模块,用于从网络中获得与所述搜索字符串对应的网络提问信息;
第二判断模块,用于判断所述网络提问信息是否存在满足第二预设条件的答案;
其中,如果所述第二判断模块的判断结果为否,通过所述响应模块执行所述响应所述搜索请求的步骤。
由于本发明第四方面所介绍的装置,为实施本发明实施例第二方面所介绍的信息处理方法所采用的装置,基于本发明实施例第二方面所介绍的信息处理方法,本领域所属技术人员能够了解本发明实施例第四方面所介绍的装置的具体结构及变形,故而在此不再赘述,凡是实施本发明实施例第二方面所介绍的信息处理方法所采用的装置都属于本发明所欲保护的范围。
第五方面,基于同一发明构思,本发明实施例提供一种设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
通过搜索字符串在预设网站搜索获得基础数据;
从所述基础数据中确定出与所述搜索字符串关联的至少一个特征数据;
分别确定出与每个所述特征数据匹配的第一类搜索结果;
依据所述至少一个特征数据对应的第一类搜索结果,生成所述搜索字符串对应的第二类搜索结果。
举例来说,该设备例如为服务器或者客户端设备。
由于本发明第五方面所介绍的设备,为实施本发明实施例第一方面所介绍的信息处理方法所采用的设备,基于本发明实施例第一方面所介绍的信息处理方法,本领域所属技术人员能够了解本发明实施例第五方面所介绍的设备的具体结构及变形,故而在此不再赘述,凡是实施本发明实施例第一方面所介绍的信息处理方法所采用的设备都属于本发明所欲保护的范围。
第六方面,基于同一发明构思,本发明实施例提供一种客户端设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
接收用户通过预设搜索界面产生的包含搜索字符串的搜索请求;
响应所述搜索请求,确定出与所述搜索字符串匹配的第二类搜索结果,所述第二类搜索结果中包含:与所述搜索字符串关联的至少一个特征数据以及每个特征数据分别对应的第一类搜索结果,所述特征数据基于通过所述搜索字符串搜索获得的基础数据确定;
将所述第二类搜索结果作为与所述搜索字符串匹配的搜索结果项展示给所述用户。
由于本发明第六方面所介绍的客户端设备,为实施本发明实施例第二方面所介绍的信息处理方法所采用的客户端设备,基于本发明实施例第二方面所介绍的信息处理方法,本领域所属技术人员能够了解本发明实施例第六方面所介绍的客户端设备的具体结构及变形,故而在此不再赘述,凡是实施本发明实施例第二方面所介绍的信息处理方法所采用的客户端设备都属于本发明所欲保护的范围。
图5是根据一示例性实施例示出的一种信息处理方法的客户端设备800的框图。例如,客户端设备800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图5,客户端设备800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制客户端设备800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理部件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在客户端设备800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件806为客户端设备800的各种组件提供电力。电力组件806可以包括电源管理系统,一个或多个电源,及其他与为客户端设备800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述客户端设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当客户端设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当客户端设备800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为客户端设备800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为客户端设备800的显示器和小键盘,传感器组件814还可以检测客户端设备800或客户端设备800一个组件的位置改变,用户与客户端设备800接触的存在或不存在,客户端设备800方位或加速/减速和客户端设备800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于客户端设备800和其他设备之间有线或无线方式的通信。客户端设备800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,客户端设备800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由客户端设备800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由客户端设备的处理器执行时,使得客户端设备能够执行一种信息处理方法,所述方法包括:通过搜索字符串在预设网站搜索获得基础数据;从所述基础数据中确定出与所述搜索字符串关联的至少一个特征数据;分别确定出与每个所述特征数据匹配的第一类搜索结果;依据所述至少一个特征数据对应的第一类搜索结果,生成所述搜索字符串对应的第二类搜索结果。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由客户端设备的处理器执行时,使得客户端设备能够执行一种信息处理方法,所述方法包括:接收用户通过预设搜索界面产生的包含搜索字符串的搜索请求;响应所述搜索请求,确定出与所述搜索字符串匹配的第二类搜索结果,所述第二类搜索结果中包含:与所述搜索字符串关联的至少一个特征数据以及每个特征数据分别对应的第一类搜索结果,所述特征数据基于通过所述搜索字符串搜索获得的基础数据确定;将所述第二类搜索结果作为与所述搜索字符串匹配的搜索结果项展示给所述用户。
图6是本发明实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由服务器的处理器执行时,使得服务器能够执行一种信息处理方法,所述方法包括:通过搜索字符串在预设网站搜索获得基础数据;从所述基础数据中确定出与所述搜索字符串关联的至少一个特征数据;分别确定出与每个所述特征数据匹配的第一类搜索结果;依据所述至少一个特征数据对应的第一类搜索结果,生成所述搜索字符串对应的第二类搜索结果。
本发明一个或多个实施例,至少具有以下有益效果:
由于在本发明实施例中,在进行网络搜索时,可以通过搜索字符串在预设网站搜索获得基础数据;从所述基础数据中确定出与所述搜索字符串关联的至少一个特征数据;分别确定出与每个所述特征数据匹配的第一类搜索结果;依据所述至少一个特征数据对应的第一类搜索结果,生成所述搜索字符串对应的第二类搜索结果。也就是说,在提供通过搜索字符串进行搜索的搜索结果时,提供的是对应的搜索字符串的至少一个特征数据中的每类特征数据的搜索结果,其基于特征数据对各个搜索结果进行了区分,故而为搜索关键词提供了更加准确的搜索结果。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令设备的制造品,该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (20)

1.一种信息处理方法,其特征在于,包括:
通过搜索字符串在预设网站搜索获得基础数据;
从所述基础数据中确定出与所述搜索字符串关联的至少一个特征数据;
分别确定出与每个所述特征数据匹配的第一类搜索结果,包括:基于每个所述特征数据所在的基础数据确定每个所述特征数据匹配的第一类搜索结果;或者,将所述搜索字符串与每个特征数据分别组合为新的搜索关键词;通过所述新的搜索关键词在网络中搜索获得每个所述特征数据匹配的第一类搜索结果;
依据所述至少一个特征数据对应的第一类搜索结果,生成所述搜索字符串对应的第二类搜索结果。
2.如权利要求1所述的方法,其特征在于,所述从所述基础数据中确定出与所述搜索字符串关联的至少一个特征数据,包括:
从所述基础数据中提取出与所述搜索字符串位于同一页面的至少一个关键词;
从所述至少一个关键词中确定出出现次数满足第一预设条件的关联关键词;
将所述出现次数满足第一预设条件的关联关键词作为所述特征数据。
3.如权利要求2所述的方法,其特征在于,所述从所述至少一个关键词中确定出出现次数满足第一预设条件的关联关键词,包括:
对所述至少一个关键词基于语义相关性进行归一化处理,获得归一化处理后的关键词;
从所述归一化处理后的关键词中确定出出现次数满足所述第一预设条件的关联关键词。
4.如权利要求1所述的方法,其特征在于,在所述通过搜索字符串在预设网站搜索获得基础数据之前,所述方法还包括:
从网络中获得网络提问信息;
判断所述网络提问信息是否存在满足第二预设条件的答案;
如果不存在,将所述网络提问信息作为所述搜索字符串,执行所述通过搜索字符串在预设网站搜索获得基础数据的步骤。
5.一种信息处理方法,其特征在于,包括:
接收用户通过预设搜索界面产生的包含搜索字符串的搜索请求;
响应所述搜索请求,确定出与所述搜索字符串匹配的第二类搜索结果,所述第二类搜索结果中包含:与所述搜索字符串关联的至少一个特征数据以及,所述特征数据基于通过所述搜索字符串搜索获得的基础数据确定,其中,每个特征数据分别对应的第一类搜索结果通过以下步骤确定:基于每个所述特征数据所在的基础数据确定每个所述特征数据匹配的第一类搜索结果;或者,将所述搜索字符串与每个特征数据分别组合为新的搜索关键词;通过所述新的搜索关键词在网络中搜索获得每个所述特征数据匹配的第一类搜索结果;
将所述第二类搜索结果作为与所述搜索字符串匹配的搜索结果项展示给所述用户。
6.如权利要求5所述的方法,其特征在于,所述确定出与所述搜索字符串匹配的第二类搜索结果,包括:
在对应关系表中获取与所述搜索字符串匹配的预存字符串,将所述匹配的预存字符串对应的搜索结果作为与所述搜索字符串匹配的第二类搜索结果;
或者,
将所述搜索字符串发送至服务器,以使所述服务器基于所述搜索字符串返回与所述搜索字符串匹配的所述第二类搜索结果;其中,所述服务器在对应关系表中获取与所述搜索字符串匹配的预存字符串,将所述匹配的预存字符串对应的搜索结果作为与所述搜索字符串匹配的第二类搜索结果。
7.如权利要求5所述的方法,其特征在于,所述将所述第二类搜索结果作为与所述搜索字符串匹配的搜索结果项展示给所述用户,包括:
将所述第二类搜索结果的显示区域划分为与所述特征数据对应数目的子区域;
将每个所述特征数据对应的第一类搜索结果分别显示于所述显示区域的不同子区域中。
8.如权利要求5-7任一所述的方法,其特征在于,在所述接收用户通过预设搜索界面产生的包含搜索字符串的搜索请求之后,所述响应所述搜索请求之前,所述方法还包括:
从网络中获得与所述搜索字符串对应的网络提问信息;
判断所述网络提问信息是否存在满足第二预设条件的答案;
如果不存在,执行所述响应所述搜索请求的步骤。
9.一种信息处理装置,其特征在于,包括:
搜索模块,用于通过搜索字符串在预设网站搜索获得基础数据;
第一确定模块,用于从所述基础数据中确定出与所述搜索字符串关联的至少一个特征数据;
第二确定模块,用于分别确定出与每个所述特征数据匹配的第一类搜索结果,包括:基于每个所述特征数据所在的基础数据确定每个所述特征数据匹配的第一类搜索结果;或者,将所述搜索字符串与每个特征数据分别组合为新的搜索关键词;通过所述新的搜索关键词在网络中搜索获得每个所述特征数据匹配的第一类搜索结果;
生成模块,用于依据所述至少一个特征数据对应的第一类搜索结果,生成所述搜索字符串对应的第二类搜索结果。
10.如权利要求9所述的装置,其特征在于,所述第一确定模块,包括:
提取单元,用于从所述基础数据中提取出与所述搜索字符串位于同一页面的至少一个关键词;
第一确定单元,用于从所述至少一个关键词中确定出出现次数满足第一预设条件的关联关键词;
第二确定单元,用于将所述出现次数满足第一预设条件的关联关键词作为所述特征数据。
11.如权利要求10所述的装置,其特征在于,所述第一确定单元,包括:
归一子单元,用于对所述至少一个关键词基于语义相关性进行归一化处理,获得归一化处理后的关键词;
确定子单元,用于从所述归一化处理后的关键词中确定出出现次数满足所述第一预设条件的关联关键词。
12.如权利要求9所述的装置,其特征在于,所述装置还包括:
第一获得模块,用于从网络中获得网络提问信息;
第一判断模块,用于判断所述网络提问信息是否存在满足第二预设条件的答案;
其中,如果所述第一判断模块的判断结果为否,将所述网络提问信息作为所述搜索字符串,通过所述搜索模块执行所述通过搜索字符串在预设网站搜索获得基础数据的步骤。
13.一种信息处理装置,其特征在于,包括:
接收模块,用于接收用户通过预设搜索界面产生的包含搜索字符串的搜索请求;
响应模块,用于响应所述搜索请求,确定出与所述搜索字符串匹配的第二类搜索结果,所述第二类搜索结果中包含:与所述搜索字符串关联的至少一个特征数据以及每个特征数据分别对应的第一类搜索结果,所述特征数据基于通过所述搜索字符串搜索获得的基础数据确定,其中,每个特征数据分别对应的第一类搜索结果通过以下步骤确定:基于每个所述特征数据所在的基础数据确定每个所述特征数据匹配的第一类搜索结果;或者,将所述搜索字符串与每个特征数据分别组合为新的搜索关键词;通过所述新的搜索关键词在网络中搜索获得每个所述特征数据匹配的第一类搜索结果;
展示模块,用于将所述第二类搜索结果作为与所述搜索字符串匹配的搜索结果项展示给所述用户。
14.如权利要求13所述的装置,其特征在于,所述响应模块,用于:
在对应关系表中获取与所述搜索字符串匹配的预存搜索字符串,将所述匹配的预存搜索字符串对应的搜索结果作为与所述搜索字符串匹配的第二类搜索结果;或者,
将所述搜索字符串发送至服务器,以使所述服务器基于所述搜索字符串返回与所述搜索字符串匹配的所述第二类搜索结果;其中,所述服务器在对应关系表中获取与所述搜索字符串匹配的预存字符串,将所述匹配的预存字符串对应的搜索结果作为与所述搜索字符串匹配的第二类搜索结果。
15.如权利要求13所述的装置,其特征在于,所述展示模块,包括:
划分单元,用于将所述第二类搜索结果的显示区域划分为与所述特征数据对应数目的子区域;
显示单元,用于将每个所述特征数据对应的第一类搜索结果分别显示于所述显示区域的不同子区域中。
16.如权利要求13~15任一所述的装置,其特征在于,所述装置还包括:
第二获得模块,用于从网络中获得与所述搜索字符串对应的网络提问信息;
第二判断模块,用于判断所述网络提问信息是否存在满足第二预设条件的答案;
其中,如果所述第二判断模块的判断结果为否,通过所述响应模块执行所述响应所述搜索请求的步骤。
17.一种信息处理 设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
通过搜索字符串在预设网站搜索获得基础数据;
从所述基础数据中确定出与所述搜索字符串关联的至少一个特征数据;
分别确定出与每个所述特征数据匹配的第一类搜索结果,包括:基于每个所述特征数据所在的基础数据确定每个所述特征数据匹配的第一类搜索结果;或者,将所述搜索字符串与每个特征数据分别组合为新的搜索关键词;通过所述新的搜索关键词在网络中搜索获得每个所述特征数据匹配的第一类搜索结果;
依据所述至少一个特征数据对应的第一类搜索结果,生成所述搜索字符串对应的第二类搜索结果。
18.一种客户端设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
接收用户通过预设搜索界面产生的包含搜索字符串的搜索请求;
响应所述搜索请求,确定出与所述搜索字符串匹配的第二类搜索结果,所述第二类搜索结果中包含:与所述搜索字符串关联的至少一个特征数据以及每个特征数据分别对应的第一类搜索结果,所述特征数据基于通过所述搜索字符串搜索获得的基础数据确定,其中,每个特征数据分别对应的第一类搜索结果通过以下步骤确定:基于每个所述特征数据所在的基础数据确定每个所述特征数据匹配的第一类搜索结果;或者,将所述搜索字符串与每个特征数据分别组合为新的搜索关键词;通过所述新的搜索关键词在网络中搜索获得每个所述特征数据匹配的第一类搜索结果;
将所述第二类搜索结果作为与所述搜索字符串匹配的搜索结果项展示给所述用户。
19.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时可以实现如权利要求1~4任一权项所述的方法步骤。
20.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时可以实现如权利要求5~8任一权项所述的方法步骤。
CN201611042822.1A 2016-11-11 2016-11-11 一种信息处理方法、装置、设备及客户端设备 Active CN108073664B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611042822.1A CN108073664B (zh) 2016-11-11 2016-11-11 一种信息处理方法、装置、设备及客户端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611042822.1A CN108073664B (zh) 2016-11-11 2016-11-11 一种信息处理方法、装置、设备及客户端设备

Publications (2)

Publication Number Publication Date
CN108073664A CN108073664A (zh) 2018-05-25
CN108073664B true CN108073664B (zh) 2021-08-31

Family

ID=62161507

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611042822.1A Active CN108073664B (zh) 2016-11-11 2016-11-11 一种信息处理方法、装置、设备及客户端设备

Country Status (1)

Country Link
CN (1) CN108073664B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109410004A (zh) * 2018-10-29 2019-03-01 维沃移动通信有限公司 一种推荐方法、装置及移动终端
CN110598993B (zh) * 2019-08-19 2023-04-18 深圳市鹏海运电子数据交换有限公司 数据加工方法及装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090254499A1 (en) * 2008-04-07 2009-10-08 Microsoft Corporation Techniques to filter media content based on entity reputation
CN102591948A (zh) * 2011-12-27 2012-07-18 厦门市美亚柏科信息股份有限公司 一种基于用户行为分析的搜索结果改进的方法及其系统
CN103377245A (zh) * 2012-04-27 2013-10-30 腾讯科技(深圳)有限公司 一种自动问答方法及装置
CN103577558A (zh) * 2013-10-21 2014-02-12 北京奇虎科技有限公司 一种优化问答对的搜索排名的装置和方法
CN103744881A (zh) * 2013-12-20 2014-04-23 百度在线网络技术(北京)有限公司 一种问答平台的问题分发方法和问题分发系统
CN103902652A (zh) * 2014-02-27 2014-07-02 深圳市智搜信息技术有限公司 自动问答系统
CN104133817A (zh) * 2013-05-02 2014-11-05 深圳市世纪光速信息技术有限公司 网络社区交互方法、装置及网络社区平台
CN104503991A (zh) * 2014-12-03 2015-04-08 百度在线网络技术(北京)有限公司 一种信息搜索方法和装置
CN104615755A (zh) * 2015-02-12 2015-05-13 北京航空航天大学 一种基于众包的新型问答系统
CN105701254A (zh) * 2016-03-09 2016-06-22 北京搜狗科技发展有限公司 一种信息处理方法和装置、一种用于信息处理的装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090254499A1 (en) * 2008-04-07 2009-10-08 Microsoft Corporation Techniques to filter media content based on entity reputation
CN102591948A (zh) * 2011-12-27 2012-07-18 厦门市美亚柏科信息股份有限公司 一种基于用户行为分析的搜索结果改进的方法及其系统
CN103377245A (zh) * 2012-04-27 2013-10-30 腾讯科技(深圳)有限公司 一种自动问答方法及装置
CN104133817A (zh) * 2013-05-02 2014-11-05 深圳市世纪光速信息技术有限公司 网络社区交互方法、装置及网络社区平台
CN103577558A (zh) * 2013-10-21 2014-02-12 北京奇虎科技有限公司 一种优化问答对的搜索排名的装置和方法
CN103744881A (zh) * 2013-12-20 2014-04-23 百度在线网络技术(北京)有限公司 一种问答平台的问题分发方法和问题分发系统
CN103902652A (zh) * 2014-02-27 2014-07-02 深圳市智搜信息技术有限公司 自动问答系统
CN104503991A (zh) * 2014-12-03 2015-04-08 百度在线网络技术(北京)有限公司 一种信息搜索方法和装置
CN104615755A (zh) * 2015-02-12 2015-05-13 北京航空航天大学 一种基于众包的新型问答系统
CN105701254A (zh) * 2016-03-09 2016-06-22 北京搜狗科技发展有限公司 一种信息处理方法和装置、一种用于信息处理的装置

Also Published As

Publication number Publication date
CN108073664A (zh) 2018-05-25

Similar Documents

Publication Publication Date Title
CN107992604B (zh) 一种任务条目的分发方法及相关装置
CN107621886B (zh) 一种输入推荐方法、装置及电子设备
CN107315487B (zh) 一种输入处理方法、装置及电子设备
CN107291772B (zh) 一种搜索访问方法、装置及电子设备
CN107229403B (zh) 一种信息内容选择方法及装置
CN108073303B (zh) 一种输入方法、装置及电子设备
CN106815291B (zh) 搜索结果项展现方法、装置和用于搜索结果项展现的装置
CN111382339A (zh) 一种搜索处理方法、装置和用于搜索处理的装置
CN111708943B (zh) 一种搜索结果展示方法、装置和用于搜索结果展示的装置
CN107665218B (zh) 一种搜索方法、装置及电子设备
CN112307281A (zh) 一种实体推荐方法及装置
CN110110207B (zh) 一种信息推荐方法、装置及电子设备
CN108073664B (zh) 一种信息处理方法、装置、设备及客户端设备
WO2017012278A1 (zh) 任务展示方法和装置
CN108628461B (zh) 一种输入方法和装置、一种更新词库的方法和装置
CN106776990B (zh) 一种信息处理方法、装置及电子设备
CN109918565B (zh) 一种搜索数据的处理方法、装置及电子设备
CN111752436A (zh) 一种推荐方法、装置和用于推荐的装置
CN109901726B (zh) 一种候选词生成方法、装置及用于候选词生成的装置
CN107436896B (zh) 一种输入推荐方法、装置及电子设备
CN112052395B (zh) 一种数据处理方法及装置
CN108205534B (zh) 一种皮肤资源展示方法、装置及电子设备
CN113918661A (zh) 知识图谱生成方法、装置和电子设备
CN109917927B (zh) 一种候选项确定方法和装置
CN107870941B (zh) 一种网页排序方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant