CN105630937A - 一种搜索试题答案的方法以及装置 - Google Patents

一种搜索试题答案的方法以及装置 Download PDF

Info

Publication number
CN105630937A
CN105630937A CN201510976106.XA CN201510976106A CN105630937A CN 105630937 A CN105630937 A CN 105630937A CN 201510976106 A CN201510976106 A CN 201510976106A CN 105630937 A CN105630937 A CN 105630937A
Authority
CN
China
Prior art keywords
content matching
result
examination question
matching result
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510976106.XA
Other languages
English (en)
Inventor
王艳丽
吴凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201510976106.XA priority Critical patent/CN105630937A/zh
Publication of CN105630937A publication Critical patent/CN105630937A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

本发明公开了一种搜索试题答案的方法以及装置,其中,所述方法包括:根据用户输入的试题类查询词,获得与所述查询词相匹配的一个或多个排序后的第一内容匹配结果;根据所述查询词在第三方试题数据库获得与所述查询词相匹配的一个或多个第二内容匹配结果;将第二内容匹配结果与所述第一内容匹配结果组合形成检索结果项提供给用户。本发明公开的方法以及装置,提高了试题类搜索的准确率、命中率,且由于第三方试题数据库数据结构清晰、稳定,数据更新及时,因此该方法以及装置还能够较大程度的提高试题类搜索的效率。

Description

一种搜索试题答案的方法以及装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种网络搜索方法及装置。
背景技术
搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页,为了用户便于判断,除了网页标题和URL外还会提供一段来自网页的摘要以及其他信息。
随着在线教育的兴起,以及中小学课堂上也越来越多地引入了在线课堂等原因,试题类型的搜索词量越来越大。图1为现有技术中试题类搜索的搜索结果页。用户输入“一段铜线的电阻是R”,搜索结果页显示多个命中的搜索结果,现有技术的展现方式一般包括标题,摘要,和站点名。如图1中,三个检索结果项,标题和摘要都不能直接反应试题类结果的特点,仅从展示的标题和摘要,用户难以判断哪一个结果是和要检索的题目完全一致。现有技术中,当用户进行试题类搜索时,从搜索结果页难以直接获得试题和解答,用户需要逐条点击进入落地页,才能进一步确认是否是自己需要的内容。
因此,现有技术的缺点在于:用户检索试题的搜索词较一般长,规律性不强,还可能包括局部公式、局部试题或者完整的公式和试题等,检索结果的匹配度有待提高。此外,搜索结果一般为标题,普通摘要,和站点名,其中摘要或标题中与搜索词的个别字段匹配,用户很难高效地确定并获得目标搜索结果。
发明内容
鉴于上述问题,提出了本发明提供一种搜索试题答案的方法和装置,以便克服试题类型搜索时,用户获得目标搜索结果的效率不够高的问题。
根据本发明的一个方面,提供了一种搜索试题答案的方法,其包括:根据用户输入的试题类查询词,获得与查询词相匹配的一个或多个排序后的第一内容匹配结果;根据查询词在第三方试题数据库获得与查询词相匹配的一个或多个第二内容匹配结果;将第二内容匹配结果与第一内容匹配结果组合形成检索结果项提供给用户。
可选地,在根据本发明的实施例的搜索试题答案的方法中,将第二内容匹配结果与第一内容匹配结果组合形成检索结果项具体为:将第二内容匹配结果排列在第一内容匹配结果之前。
可选地,在根据本发明的实施例的搜索试题答案的方法中,当第二内容匹配结果与第一内容匹配结果中的一项为同一站点下的结果,则在检索结果项中去除所述第一内容匹配结果中的对应项。
可选地,在根据本发明的实施例的搜索试题答案的方法中,将检索结果项中前预定数量的结果项进行强显示,强显示为显示全部的题目信息以及至少部分试题解答信息。
可选地,在根据本发明的实施例的搜索试题答案的方法中,将检索结果项中排序第一的结果项进行强显示,强显示为显示全部的题目信息以及至少部分试题解答信息。
可选地,在根据本发明的实施例的搜索试题答案的方法中,强显示还包括显示至少一个以下信息:考点信息,专题信息,难度信息,关联知识点信息。
可选地,在根据本发明的实施例的搜索试题答案的方法中,还包括:点击对应链接的落地页以查看试题解答信息的全部内容。
可选地,在根据本发明的实施例的搜索试题答案的方法中,试题解答信息包括至少一个以下信息:试题答案,解题思路,解题过程。
可选地,在根据本发明的实施例的搜索试题答案的方法中,将第二内容匹配结果与第一内容匹配结果组合形成检索结果项具体为,将第二内容匹配结果排序后与第一内容匹配结果组合形成检索结果项。
可选地,在根据本发明的实施例的搜索试题答案的方法中,将第二内容匹配结果排序具体为根据与查询词的相似度和/或站点导出量对第二内容匹配结果进行排序。
根据本发明的另一个方面,提供了一种搜索试题答案的装置包括:第一结果获取模块,根据用户输入的试题类查询词,获得与查询词相匹配的一个或多个第一内容匹配结果;第二结果获取模块,根据查询词在第三方试题数据库获得与查询词相匹配的一个或多个第二内容匹配结果;结果提供模块,将第二内容匹配结果与第一内容匹配结果组合形成检索结果项提供给用户。
可选地,在根据本发明的实施例的搜索试题答案的装置中,将第二内容匹配结果与所述第一内容匹配结果组合形成检索结果项具体为:将第二内容匹配结果排列在第一内容匹配结果之前。
可选地,在根据本发明的实施例的搜索试题答案的装置中,结果提供模块还包括删除模块,用于当第二内容匹配结果与第一内容匹配结果中的一项为同一站点下的结果,则在检索结果项中去除所述第一内容匹配结果中的对应项。
可选地,在根据本发明的实施例的搜索试题答案的装置中,装置还包括显示模块,用于将检索结果项中前预定数量的结果项进行强显示,强显示为显示全部的题目信息以及至少部分试题解答信息。
可选地,在根据本发明的实施例的搜索试题答案的装置中,装置还包括显示模块,用于将检索结果项中排序第一的结果项进行强显示,强显示为显示全部的题目信息以及至少部分试题解答信息。
可选地,在根据本发明的实施例的搜索试题答案的装置中,强显示还包括显示至少一个以下信息:考点信息,专题信息,难度信息,关联知识点信息。
可选地,在根据本发明的实施例的搜索试题答案的装置中,还包括:所述显示模块显示对应链接,用户点击所述链接进入落地页查看试题解答信息的全部内容。
可选地,在根据本发明的实施例的搜索试题答案的装置中,试题解答信息包括至少一个以下信息:试题答案,解题思路,解题过程。
可选地,在根据本发明的实施例的搜索试题答案的装置中,将第二内容匹配结果与第一内容匹配结果组合形成检索结果项具体为,将第二内容匹配结果排序后与第一内容匹配结果组合形成检索结果项。
可选地,在根据本发明的实施例的搜索试题答案的装置中,将第二内容匹配结果排序具体为根据与查询词的相似度和/或站点导出量对第二内容匹配结果进行排序。
本发明的有益效果为:将第三方试题数据库的检索结果与常规检索结果组合提供给用户,提高了试题类搜索的准确率、命中率,且由于第三方试题数据库数据结构清晰、稳定,数据更新及时,本发明提供的方法和装置还能够较大程度的提高试题类搜索的效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示意性示出了现有技术中试题类搜索的搜索结果页;
图2示意性示出了本发明中搜索试题答案的方法一个实施例的流程示意图;
图3示意性示出了本发明中搜索试题答案的方法一个实施例的结果示意图;
图4示意性示出了本发明中搜索试题答案的装置一个实施例的装置结构图。
具体实施例
下面结合附图和具体的实施方式对本发明作进一步的描述。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
图2为本发明中搜索试题答案的方法一个实施例的流程示意图。根据本发明的方法包括由网络设备执行的步骤S110、步骤S120和步骤S130。
其中,网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(CloudComputing)的由大量主机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
步骤S110,根据用户输入的试题类查询词,获得与查询词相匹配的一个或多个排序后的第一内容匹配结果;步骤S120,根据查询词在第三方试题数据库获得与查询词相匹配的一个或多个第二内容匹配结果;步骤S130,将第二内容匹配结果与第一内容匹配结果组合形成检索结果项提供给用户。
本方案的实施例中,通过检索获得第一内容匹配结果,以相同的搜索词检索第三方试题库获得第二匹配内容,将第一匹配内容与第二匹配内容组合后形成检索结果项提供给用户。组合的方式可以是多种的,例如综合排序,或者将第二匹配内容排在第一匹配内容之前,或者将第一匹配内容与第二匹配内容间插后形成检索结果项。本领域技术人员可知,组合的方式包括但不限于以上几种方式。
在步骤S110中,根据用户输入的试题类查询词,获得与查询词相匹配的一个或多个排序后的第一内容匹配结果。
具体地,用户通过用户终端设备在搜索引擎的输入框中输入查询词,并通过用户终端设备发送至网络设备;网络设备接收到该查询词,对该查询词进行切词处理,来确定一个或多个查询关键词;随后,基于一个或多个查询关键词在网页索引库中进行匹配来获取相应的内容匹配结果,随后对内容匹配结果进行排序,获取与查询词相匹配的排序后的一个或多个内容匹配结果。
在本发明的某一具体实施方式中,检测排序后的一个或多个内容匹配结果对应链接的落地页是否包含平级图文列表字段,如果所述落地页包含平级图文列表字段,则提取与试题特征字段相应的内容。
本发明中,落地页是指搜索结果项对应URL链接指向的页面。进一步地,落地页中可包括满足用户查询需求的多个子页面信息。
其中,平级图文列表字段包括以下一种或多种的组合:
列表类型标记语言字段;例如,在网页的HTML文件中,列表类型标记语言字段可包括type定值中的datalist字段,指示HTML文件中包括多个data数组,在网页中可展现为列表形式;
统一资源定位符、标题信息相关联记录的多个标记语言字段;例如,网页的HTML文件中包括多个data数组,每一data数组均包括url/title两个字段,分别对应于URL和标题,多个data数组在网页中可展现为列表形式;
统一资源定位符、标题信息及图片信息相关联记录的多个标记语言字段;例如,网页的HTML文件中包括多个data数组,每一data数组均包括url/title/img三个字段,分别对应于URL、标题和图片,多个data数组在网页中可展现为列表形式。可选地,网页的HTML文件中还可包括imgsize字段,该imgsize字段表示每个data数组中的图片大小;例如,imgsize字段取值为:big:大图;或small:小图;或noimg:无图。
具体地,检测排序后的一个或多个内容匹配结果对应链接的落地页是否包含平级图文列表字段的方式可为:读取排序后的一个或多个内容匹配结果对应链接的落地页的HTML文件,并检测HTML文件中是否包括预定的平级图文列表字段。
若检测HTML文件中包括预定的平级图文列表字段,则提取能够表征试题特性的试题字段的相应内容。
在本发明的某一具体实施方式中,提取与试题特征字段相应的内容可以具体为步骤:检测排序后的一个或多个内容匹配结果对应链接的落地页是否进行过结构化处理;如果落地页进行过结构化处理,则提取与试题特征字段相应的内容。
可选的,可以预先建立试题摘要模板,试题摘要模板包括但是不限于type字段,question字段,point字段,zhuanti字段,nandu字段,orgimg字段之一或者组合。
对内容匹配结果对应链接的落地页进行结构化处理是对包含平级图文列表字段的落地页对应的检索结果项,根据试题摘要模板提取相应的内容,重新生成包含试题摘要信息的检索结果项。
根据本发明一实施例,对落地页进行结构化处理可以是以下方式:
当查询词确定为试题类查询词时,对返回的一个或多个检索结果项进行结构化处理。例如,当用户搜索试题一时,确定内容匹配结果或检索结果项所对应的落地页并未进行过结构化处理,则对其进行结构化处理。
可选的,根据对多个试题类查询词基于热度信息进行排序的排序结果,选取排序前预定数量的查询词作为热门试题类查询词,根据热门试题类查询词来确定相应的经排序的检索结果项,并选取与每一热门试题类查询词相应的排序前预定数量的检索结果项作为热门检索结果项;提取所述热门检索结果项对应链接的热门落地页;对热门落地页进行结构化处理。
例如,热度信息可通过在一定时间内用户的搜索次数、对搜索结果的浏览时长等维度来确定,对用户输入的多个试题类查询词基于热度信息来排序后,选择排序前预定数量,如排序前五位,的查询词作为热门查询词;对热门查询词进行搜索、排序等处理后,获取每一查询词相应的经排序的检索结果项,选取与每一热门查询词相应的排序前预定数量的检索结果项,如排序前两位的搜检索结果项,作为热门检索结果项;提取热门检索结果项对应URL指向的热门落地页,并对热门落地页进行结构化处理。
在步骤S120中,根据所述查询词在第三方试题数据库获得与所述查询词相匹配的一个或多个第二内容匹配结果。
第三方试题数据库,例如“拍题”APP等。一般情况下,第三方试题数据库中的数据是依据试题类数据的特点进行存储的,包括了试题特征字段。
试题特征字段是指表示试题特征的字段。可选的,试题特征字段包括但不限于,题目字段,解答字段,考点字段,专题字段,难度字段。本领域技术人员可以确定,还可以包括其他能够表征试题特征的试题字段。
例如在某试题数据库中,试题类数据包括但不限于以下字段:
question,题目字段,其字段对应存储题目的题干内容,例如试题一:“一段铜线的电阻是R,两端电压是U,通过电流强度为I,下列说法正确的是”
solution,解答字段,其字段对应存储题目的答案。可选的,还可以包括题目的解答过程,和/或题目的解题思路。
point,考点字段,其字段对应存储试题归属的知识点。例如,试题一是考查的是“电阻、影响电阻大小的因素”,因此,考点为“电阻、影响电阻大小的因素”。用户根据考点字段的信息能够有迅速,有针对性的找到试题所在知识点以及相关知识点,有助于进一步的巩固知识点。
zhuanti,专题字段,其字段对应存储试题类型。例如,试题一的试题类型是应用题。
nandu,难度字段,其字段对应存储试题难度。
orgimg,图片字段,其字段对应存储试题相关图片。图片字段可以根据需要设置或者不设置。
在本实施例中,以上字段是可以根据实际需要设置一个或多个的组合。
由于第三方题库的数据具有明显的试题类数据特性,因此,匹配结果的效率和质量都有较大的提升,而且由于第三方题库数据的更新一般比较及时,因此,能够进一步提高试题类检索的效率。
试题特征字段对试题的不同特征进行了区分存储,针对用户的查询,部分或者全部展示给用户。不仅对题目本身可以一目了然,解答,思路,以及涉及知识点,试题专题也均可以提供给用户,使得用户高效的获知习题答案的同时,能够对知识点掌握情况以及知识架构有初步的认知,可以帮助用户进一步完善自己的知识体系。
根据查询词在第三方试题数据库获得与查询词相匹配的一个或多个第二内容匹配结果。第二内容匹配结果可以是一个第三方数据库中的一个或多个匹配结果,也可以是多个第三方数据库中的多个匹配结果。
第三方数据库中的匹配结果为多个时,可以对第三方数据库的匹配结果进行排序。例如,根据以下一个或多个因素的组合进行排序:结果的近似程度,结果的评价多少,结果的评分,落地页点击量,站点导出量等。
在步骤S130中,将第二内容匹配结果与第一内容匹配结果组合形成检索结果项提供给用户。
可选的,将第二内容匹配结果排列在所述第一内容匹配结果之前。当第二内容匹配结果与所述第一内容匹配结果中的一项为同一站点下的结果,则在检索结果项中去除所述第一内容匹配结果中的对应项。
可选的,将第一内容匹配结果和第二内容匹配内容综合排序后提供给用户。
可选的,将第一内容匹配结果和第二内容匹配内容间插排序后提供给用户。
可选的,对于检索结果项,将检索结果项中前预定数量的结果项进行强显示,强显示为显示题目主要信息以及至少部分试题解答信息。其中题目主要信息是可以让用户排除或确定是否是自己搜索的目标的信息,可以是试题的全部,也可以是试题的主干。用户可以点击对应链接的落地页以查看所述试题解答信息的全部内容。
可选的,将检索结果项中排序第一的结果项进行强显示,所述强显示为显示题目主要信息以及至少部分试题解答信息。其中题目主要信息是可以让用户排除或确定是否是自己搜索的目标的信息,可以是试题的全部,也可以是试题的主干。用户可以点击对应链接的落地页以查看所述试题解答信息的全部内容。
可选的,强显示还包括(但不限于)显示至少一个以下信息:考点信息,专题信息,难度信息,关联知识点信息。
可选的,试题解答信息包括(但不限于)至少一个以下信息:试题答案,解题思路,解题过程。
图3示意性示出了本发明中搜索试题答案的方法一个实施例的结果示意图。
若用户在搜索框中输入“如图,在菱形ABCD中,AE⊥BC,E为垂足”。则提供给用户2道相关试题。试题1为第三方数据库“拍题”的结果匹配项。显示了题目主要信息,以及答案分析的部分内容。用户可以点击对应链接的落地页以查看所述试题解答信息的全部内容,以及试题其他相关信息。此外,在显示页面上,还可以提示下载第三方数据库应用。
图4示意性示出了本发明中搜索试题答案的装置一个实施例的装置结构图。本发明实施例提供的搜索试题答案的装置包括:第一结果获取模块210,第二结果获取模块220,结果提供模块230。
第一结果获取模块210,用于根据用户输入的试题类查询词,获得与查询词相匹配的一个或多个第一内容匹配结果;第二结果获取模块220,用于根据查询词在第三方试题数据库获得与查询词相匹配的一个或多个第二内容匹配结果;结果提供模块230,用于将第二内容匹配结果与第一内容匹配结果组合形成检索结果项提供给用户。
本方案的实施例中,通过检索获得第一内容匹配结果,以相同的搜索词检索第三方试题库获得第二匹配内容,将第一匹配内容与第二匹配内容组合后形成检索结果项提供给用户。组合的方式可以是多种的,例如综合排序,或者将第二匹配内容排在第一匹配内容之前,或者将第一匹配内容与第二匹配内容间插后形成检索结果项。本领域技术人员可知,组合的方式包括但不限于以上几种方式。
第一结果获取模块210,用于根据用户输入的试题类查询词,获得与查询词相匹配的一个或多个第一内容匹配结果。
具体地,用户通过用户终端设备在搜索引擎的输入框中输入查询词,并通过用户终端设备发送至网络设备;网络设备接收到该查询词,对该查询词进行切词处理,来确定一个或多个查询关键词;随后,基于一个或多个查询关键词在网页索引库中进行匹配来获取相应的内容匹配结果,随后对内容匹配结果进行排序,获取与查询词相匹配的排序后的一个或多个内容匹配结果。
在本发明的某一具体实施方式中,检测排序后的一个或多个内容匹配结果对应链接的落地页是否包含平级图文列表字段,如果所述落地页包含平级图文列表字段,则提取与试题特征字段相应的内容。
本发明中,落地页是指搜索结果项对应URL链接指向的页面。进一步地,落地页中可包括满足用户查询需求的多个子页面信息。
其中,平级图文列表字段包括以下一种或多种的组合:
列表类型标记语言字段;例如,在网页的HTML文件中,列表类型标记语言字段可包括type定值中的datalist字段,指示HTML文件中包括多个data数组,在网页中可展现为列表形式;
统一资源定位符、标题信息相关联记录的多个标记语言字段;例如,网页的HTML文件中包括多个data数组,每一data数组均包括url/title两个字段,分别对应于URL和标题,多个data数组在网页中可展现为列表形式;
统一资源定位符、标题信息及图片信息相关联记录的多个标记语言字段;例如,网页的HTML文件中包括多个data数组,每一data数组均包括url/title/img三个字段,分别对应于URL、标题和图片,多个data数组在网页中可展现为列表形式。可选地,网页的HTML文件中还可包括imgsize字段,该imgsize字段表示每个data数组中的图片大小;例如,imgsize字段取值为:big:大图;或small:小图;或noimg:无图。
具体地,检测排序后的一个或多个内容匹配结果对应链接的落地页是否包含平级图文列表字段的方式可为:读取排序后的一个或多个内容匹配结果对应链接的落地页的HTML文件,并检测HTML文件中是否包括预定的平级图文列表字段。
若检测HTML文件中包括预定的平级图文列表字段,则提取能够表征试题特性的试题字段的相应内容。
在本发明的某一具体实施方式中,提取与试题特征字段相应的内容可以具体为步骤:检测排序后的一个或多个内容匹配结果对应链接的落地页是否进行过结构化处理;如果落地页进行过结构化处理,则提取与试题特征字段相应的内容。
可选的,可以预先建立试题摘要模板,试题摘要模板包括但是不限于type字段,question字段,point字段,zhuanti字段,nandu字段,orgimg字段之一或者组合。
对内容匹配结果对应链接的落地页进行结构化处理是对包含平级图文列表字段的落地页对应的检索结果项,根据试题摘要模板提取相应的内容,重新生成包含试题摘要信息的检索结果项。
根据本发明一实施例,对落地页进行结构化处理可以是以下方式:
当查询词确定为试题类查询词时,对返回的一个或多个检索结果项进行结构化处理。例如,当用户搜索试题一时,确定内容匹配结果或检索结果项所对应的落地页并未进行过结构化处理,则对其进行结构化处理。
可选的,根据对多个试题类查询词基于热度信息进行排序的排序结果,选取排序前预定数量的查询词作为热门试题类查询词,根据热门试题类查询词来确定相应的经排序的检索结果项,并选取与每一热门试题类查询词相应的排序前预定数量的检索结果项作为热门检索结果项;提取所述热门检索结果项对应链接的热门落地页;对热门落地页进行结构化处理。
例如,热度信息可通过在一定时间内用户的搜索次数、对搜索结果的浏览时长等维度来确定,对用户输入的多个试题类查询词基于热度信息来排序后,选择排序前预定数量,如排序前五位,的查询词作为热门查询词;对热门查询词进行搜索、排序等处理后,获取每一查询词相应的经排序的检索结果项,选取与每一热门查询词相应的排序前预定数量的检索结果项,如排序前两位的搜检索结果项,作为热门检索结果项;提取热门检索结果项对应URL指向的热门落地页,并对热门落地页进行结构化处理。
第二结果获取模块220,用于根据查询词在第三方试题数据库获得与查询词相匹配的一个或多个第二内容匹配结果。
第三方试题数据库,例如“拍题”APP等。一般情况下,第三方试题数据库中的数据是依据试题类数据的特点进行存储的,包括了试题特征字段。
试题特征字段是指表示试题特征的字段。可选的,试题特征字段包括但不限于,题目字段,解答字段,考点字段,专题字段,难度字段。本领域技术人员可以确定,还可以包括其他能够表征试题特征的试题字段。
例如在某试题数据库中,试题类数据包括但不限于以下字段:
question,题目字段,其字段对应存储题目的题干内容,例如试题一:“一段铜线的电阻是R,两端电压是U,通过电流强度为I,下列说法正确的是”
solution,解答字段,其字段对应存储题目的答案。可选的,还可以包括题目的解答过程,和/或题目的解题思路。
point,考点字段,其字段对应存储试题归属的知识点。例如,试题一是考查的是“电阻、影响电阻大小的因素”,因此,考点为“电阻、影响电阻大小的因素”。用户根据考点字段的信息能够有迅速,有针对性的找到试题所在知识点以及相关知识点,有助于进一步的巩固知识点。
zhuanti,专题字段,其字段对应存储试题类型。例如,试题一的试题类型是应用题。
nandu,难度字段,其字段对应存储试题难度。
orgimg,图片字段,其字段对应存储试题相关图片。图片字段可以根据需要设置或者不设置。
在本实施例中,以上字段是可以根据实际需要设置一个或多个的组合。
由于第三方题库的数据具有明显的试题类数据特性,因此,匹配结果的效率和质量都有较大的提升,而且由于第三方题库数据的更新一般比较及时,因此,能够进一步提高试题类检索的效率。
试题特征字段对试题的不同特征进行了区分存储,针对用户的查询,部分或者全部展示给用户。不仅对题目本身可以一目了然,解答,思路,以及涉及知识点,试题专题也均可以提供给用户,使得用户高效的获知习题答案的同时,能够对知识点掌握情况以及知识架构有初步的认知,可以帮助用户进一步完善自己的知识体系。
根据查询词在第三方试题数据库获得与查询词相匹配的一个或多个第二内容匹配结果。第二内容匹配结果可以是一个第三方数据库中的一个或多个匹配结果,也可以是多个第三方数据库中的多个匹配结果。
第三方数据库中的匹配结果为多个时,可以对第三方数据库的匹配结果进行排序。例如,根据以下一个或多个因素的组合进行排序:结果的近似程度,结果的评价多少,结果的评分,落地页点击量,站点导出量等。
结果提供模块230,用于将第二内容匹配结果与第一内容匹配结果组合形成检索结果项提供给用户。
可选的,将第二内容匹配结果排列在所述第一内容匹配结果之前。当第二内容匹配结果与所述第一内容匹配结果中的一项为同一站点下的结果,则在检索结果项中去除所述第一内容匹配结果中的对应项。
可选的,将第一内容匹配结果和第二内容匹配内容综合排序后提供给用户。
可选的,将第一内容匹配结果和第二内容匹配内容间插排序后提供给用户。
在某一具体实施方式中,搜索试题答案的装置还包括显示模块。
可选的,对于检索结果项,显示模块将检索结果项中前预定数量的结果项进行强显示,强显示为显示题目主要信息以及至少部分试题解答信息。其中题目主要信息是可以让用户排除或确定是否是自己搜索的目标的信息,可以是试题的全部,也可以是试题的主干。用户可以点击显示模块提供的对应链接的落地页以查看所述试题解答信息的全部内容。
可选的,对于检索结果项,显示模块将检索结果项排序第一的结果项进行强显示,强显示为显示题目主要信息以及至少部分试题解答信息。其中题目主要信息是可以让用户排除或确定是否是自己搜索的目标的信息,可以是试题的全部,也可以是试题的主干。用户可以点击显示模块提供的对应链接的落地页以查看所述试题解答信息的全部内容。
可选的,强显示还包括(但不限于)显示至少一个以下信息:考点信息,专题信息,难度信息,关联知识点信息。
可选的,试题解答信息包括(但不限于)至少一个以下信息:试题答案,解题思路,解题过程。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互任意组合。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的网络搜索系统中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
本文中所称的“一个实施例”、“实施例”或者“一个或者多个实施例”意味着,结合实施例描述的特定特征、结构或者特性包括在本发明的至少一个实施例中。此外,请注意,这里“在一个实施例中”的词语例子不一定全指同一个实施例。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
此外,还应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。

Claims (10)

1.一种搜索试题答案的方法,包括:
根据用户输入的试题类查询词,获得与所述查询词相匹配的一个或多个排序后的第一内容匹配结果;
根据所述查询词在第三方试题数据库获得与所述查询词相匹配的一个或多个第二内容匹配结果;
将第二内容匹配结果与所述第一内容匹配结果组合形成检索结果项提供给用户。
2.根据权利要求1所述的搜索试题答案的方法,其特征在于,所述将第二内容匹配结果与所述第一内容匹配结果组合形成检索结果项具体为:将第二内容匹配结果排列在所述第一内容匹配结果之前。
3.根据权利要求1-2中任一所述的搜索试题答案的方法,其特征在于,当所述第二内容匹配结果与所述第一内容匹配结果中的一项为同一站点下的结果,则在检索结果项中去除所述第一内容匹配结果中的对应项。
4.根据权利要求1-3中任一所述的搜索试题答案的方法,其特征在于,将检索结果项中前预定数量的结果项进行强显示,所述强显示为显示全部的题目信息以及至少部分试题解答信息。
5.根据权利要求1-4中任一所述的搜索试题答案的方法,其特征在于,将检索结果项中排序第一的结果项进行强显示,所述强显示为显示全部的题目信息以及至少部分试题解答信息。
6.根据权利要求1-5中任一所述的搜索试题答案的方法,其特征在于,所述强显示还包括显示至少一个以下信息:考点信息,专题信息,难度信息,关联知识点信息。
7.根据权利要求1-6中任一所述的搜索试题答案的方法,其特征在于,还包括:点击对应链接的落地页以查看所述试题解答信息的全部内容。
8.根据权利要求1-7中任一所述的搜索试题答案的方法,其特征在于,还包括:所述试题解答信息包括至少一个以下信息:试题答案,解题思路,解题过程。
9.根据权利要求1-8中任一所述的搜索试题答案的方法,其特征在于,所述将第二内容匹配结果与所述第一内容匹配结果组合形成检索结果项具体为,将第二内容匹配结果排序后与所述第一内容匹配结果组合形成检索结果项。
10.根据权利要求1-9中任一所述的搜索试题答案的方法,其特征在于,所述将第二内容匹配结果排序具体为根据与所述查询词的相似度和/或站点导出量对所述第二内容匹配结果进行排序。
CN201510976106.XA 2015-12-22 2015-12-22 一种搜索试题答案的方法以及装置 Pending CN105630937A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510976106.XA CN105630937A (zh) 2015-12-22 2015-12-22 一种搜索试题答案的方法以及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510976106.XA CN105630937A (zh) 2015-12-22 2015-12-22 一种搜索试题答案的方法以及装置

Publications (1)

Publication Number Publication Date
CN105630937A true CN105630937A (zh) 2016-06-01

Family

ID=56045870

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510976106.XA Pending CN105630937A (zh) 2015-12-22 2015-12-22 一种搜索试题答案的方法以及装置

Country Status (1)

Country Link
CN (1) CN105630937A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106095872A (zh) * 2016-06-07 2016-11-09 北京高地信息技术有限公司 用于智能问答系统的答案排序方法及装置
CN106326406A (zh) * 2016-08-22 2017-01-11 广东小天才科技有限公司 一种应用于电子终端的搜题方法及装置
CN106781782A (zh) * 2016-11-23 2017-05-31 阔地教育科技有限公司 一种信息反馈方法及装置
CN108877334A (zh) * 2018-06-12 2018-11-23 广东小天才科技有限公司 一种语音搜题方法及电子设备
CN109325051A (zh) * 2018-08-14 2019-02-12 广东小天才科技有限公司 一种基于解法模型的搜题结果输出方法及学习设备
CN110084099A (zh) * 2019-03-14 2019-08-02 北京暄暄科技有限公司 基于图像识别技术的信息反馈方法和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070078851A1 (en) * 2005-10-05 2007-04-05 Grell Mathew L System and method for filtering search query results
CN102004794A (zh) * 2010-12-09 2011-04-06 百度在线网络技术(北京)有限公司 搜索引擎系统及其实现方法
CN102043834A (zh) * 2010-11-25 2011-05-04 北京搜狗科技发展有限公司 一种客户端实现搜索的方法及搜索客户端
CN103366007A (zh) * 2013-07-22 2013-10-23 北京奇虎科技有限公司 基于地理位置的搜索方法及装置
CN104063443A (zh) * 2014-06-13 2014-09-24 百度在线网络技术(北京)有限公司 搜索结果的提供方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070078851A1 (en) * 2005-10-05 2007-04-05 Grell Mathew L System and method for filtering search query results
CN102043834A (zh) * 2010-11-25 2011-05-04 北京搜狗科技发展有限公司 一种客户端实现搜索的方法及搜索客户端
CN102004794A (zh) * 2010-12-09 2011-04-06 百度在线网络技术(北京)有限公司 搜索引擎系统及其实现方法
CN103366007A (zh) * 2013-07-22 2013-10-23 北京奇虎科技有限公司 基于地理位置的搜索方法及装置
CN104063443A (zh) * 2014-06-13 2014-09-24 百度在线网络技术(北京)有限公司 搜索结果的提供方法和装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106095872A (zh) * 2016-06-07 2016-11-09 北京高地信息技术有限公司 用于智能问答系统的答案排序方法及装置
CN106326406A (zh) * 2016-08-22 2017-01-11 广东小天才科技有限公司 一种应用于电子终端的搜题方法及装置
CN106326406B (zh) * 2016-08-22 2020-07-21 广东小天才科技有限公司 一种应用于电子终端的搜题方法及装置
CN106781782A (zh) * 2016-11-23 2017-05-31 阔地教育科技有限公司 一种信息反馈方法及装置
CN108877334A (zh) * 2018-06-12 2018-11-23 广东小天才科技有限公司 一种语音搜题方法及电子设备
CN109325051A (zh) * 2018-08-14 2019-02-12 广东小天才科技有限公司 一种基于解法模型的搜题结果输出方法及学习设备
CN110084099A (zh) * 2019-03-14 2019-08-02 北京暄暄科技有限公司 基于图像识别技术的信息反馈方法和系统

Similar Documents

Publication Publication Date Title
CN109543086B (zh) 一种面向多数据源的网络数据采集与展示方法
CN105630937A (zh) 一种搜索试题答案的方法以及装置
CN103491205B (zh) 一种基于视频搜索的关联资源地址的推送方法和装置
KR101667344B1 (ko) 검색 결과들을 제공하는 방법 및 시스템
CN103020066B (zh) 一种识别搜索需求的方法和装置
Liu et al. When web search fails, searchers become askers: Understanding the transition
US20130144860A1 (en) System and Method for Automatically Identifying Classified Websites
US20180285331A1 (en) Method, server, browser, and system for recommending text information
CN103544176A (zh) 用于生成多个页面所对应的页面结构模板的方法和设备
CN103631794A (zh) 一种用于对搜索结果进行排序的方法、装置与设备
CN103559286A (zh) 视频搜索结果的处理方法及装置
KR101559719B1 (ko) 효과적인 마케팅을 도출하는 자동학습 시스템 및 방법
CN102999489B (zh) 一种社区网站页面的图片检索方法和系统
CN105893427A (zh) 资源搜索方法以及服务器
CN102682011B (zh) 建立域名描述名称信息表、搜索的方法、装置及系统
CN103761232B (zh) 一种提供网页媒体内容信息的方法和装置
CN101894109A (zh) 一种数据库建立方法和装置
US20130246381A1 (en) Geo signal search result
CN105653600A (zh) 一种试题摘要信息的生成方法以及装置
CN105095383A (zh) 信息发布方法、搜索方法及相应装置
CN105183843B (zh) 列表页识别系统及方法
CN110908892A (zh) 接口数据测试方法、装置及可读存储介质
CN103761231A (zh) 一种搜索引擎提供网页媒体内容信息的方法和装置
CN103631793A (zh) 一种用于对搜索结果进行排序的方法、装置与设备
CN102929948B (zh) 列表页识别系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160601