CN105893570A - 搜索结果的摘要生成方法及装置 - Google Patents
搜索结果的摘要生成方法及装置 Download PDFInfo
- Publication number
- CN105893570A CN105893570A CN201610202496.XA CN201610202496A CN105893570A CN 105893570 A CN105893570 A CN 105893570A CN 201610202496 A CN201610202496 A CN 201610202496A CN 105893570 A CN105893570 A CN 105893570A
- Authority
- CN
- China
- Prior art keywords
- webpage
- complementary data
- type
- search results
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
- G06F16/972—Access to data in other repository systems, e.g. legacy data or dynamic Web page generation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种搜索结果的摘要生成方法及装置。该方法包括:接收来自用户的地点类型的查询词,搜索与所述查询词相关的一个或多个网页;从所述一个或多个网页中提取出满足地点类型判断和定位需求的辅助性数据;利用所述辅助性数据生成搜索结果的摘要,并呈现。本发明实施例中,由于辅助性数据满足地点类型判断和定位需求,将其作为搜索结果的摘要直接进行呈现,能够实现更加精准的结果对应用户查询词的需求,而无需用户进一步点击搜索结果去查看并寻找自己需要的内容,从而帮助用户完成决策并缩短多次搜索的路径,快速地实现用户的地理位置寻址需求。
Description
技术领域
本发明涉及信息搜索技术领域,特别是一种搜索结果的摘要生成方法及装置。
背景技术
随着信息技术的飞速发展,当今社会进入了信息爆炸时代,人们越来越多地借助网络来寻找自己需要的信息,因此,检索成为人们工作、生活不可或缺的一部分。
用户通常使用搜索引擎进行检索,搜索引擎会搜索与用户查询词相关的网页,并作为搜索结果返回给用户的系统。通常,搜索结果中包括网页的标题、摘要等信息,用户可以通过阅读摘要来判断搜索结果的价值。
相关技术中,搜索引擎生成摘要主要采用静态生成摘要的方法,它是以文档的主题为中心,这种方法生成的摘要虽然很好地表达了文档的中心意思,但是文档中与用户查询词相关的信息未必是文档主题,而这些信息却很有可能对用户很有价值。由此可见,目前静态生成摘要的方法很难满足用户的查询需求。
因此,如何提供一种搜索结果的摘要生成方法,使得摘要能够较好地满足用户的查询需求,成为亟待解决的技术问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的搜索结果的摘要生成方法及相应的装置。
依据本发明的一方面,提供了一种搜索结果的摘要生成方法,包括:
接收来自用户的地点类型的查询词,搜索与所述查询词相关的一个或多个网页;
从所述一个或多个网页中提取出满足地点类型判断和定位需求的辅助性数据;
利用所述辅助性数据生成搜索结果的摘要,并呈现。
可选地,搜索与所述查询词相关的一个或多个网页,包括:
将所述查询词与预先收集的地点类型的网页的URL进行匹配,将匹配到的一个或多个URL对应的网页作为与所述查询词相关的一个或多个网页,其中,所述网页的URL中包含地点信息。
可选地,从所述一个或多个网页中提取出满足地点类型判断和定位需求的辅助性数据,包括:
确定满足地点类型判断和定位需求的一个或多个信息字段;
利用所述一个或多个信息字段,从所述一个或多个网页中提取出各个信息字段对应的字段值;
将所述各个信息字段及其对应的字段值作为所述辅助性数据。
可选地,从所述一个或多个网页中提取出满足地点类型判断和定位需求的辅助性数据,包括:
从预先建立的网页数据提取模板库中,选取所述一个或多个网页各自对应的数据提取模板;
利用所述一个或多个网页各自对应的数据提取模板,从各个网页对应的文档内容中提取出满足地点类型判断和定位需求的辅助性数据。
可选地,所述方法还包括:
收集多种页面类型的网页;
分析各种页面类型的网页,确定所述各种页面类型的网页对应的文档中的满足地点类型判断和定位需求的辅助性数据在文档中的位置信息;
记录所述各种页面类型的网页、所述各种页面类型的网页对应的文档中的满足地点类型判断和定位需求的辅助性数据在文档中的位置信息之间的对应关系,生成网页数据提取模板库。
可选地,通过以下步骤确定网页的页面类型:
对大量网页的结构和/或主题进行分析,将具有相同结构和/或主题的网页划分为属于同一页面类型的网页。
可选地,若所述辅助性数据中包括电话号码,利用所述辅助性数据生成搜索结果的摘要,包括:
获取存储有骚扰电话的黑名单库;
利用所述黑名单库对所述电话号码进行骚扰电话过滤;
利用过滤后的电话号码生成搜索结果的摘要。
可选地,利用所述辅助性数据生成搜索结果的摘要,包括:
分析所述辅助性数据,确定能够对所述辅助性数据执行的操作;
生成所述操作对应的服务接口作为搜索结果的摘要。
可选地,所述方法还包括:
接收用户针对所述服务接口的触发指令,直达所述服务接口对应的服务。
可选地,所述方法还包括:
当接收到用户针对所述服务接口的触发指令时,调起服务;
显示所述服务的界面,以供所述用户进行服务项的选择。
可选地,所述服务接口的形式包括功能按键或链接。
可选地,利用所述辅助性数据生成搜索结果的摘要,包括:
将所述辅助性数据布局至预设组合样式中,生成搜索结果的摘要。
依据本发明的另一方面,还提供了一种搜索结果的摘要生成装置,包括:
搜索器,适于接收来自用户的地点类型的查询词,搜索与所述查询词相关的一个或多个网页;
数据提取器,适于从所述一个或多个网页中提取出满足地点类型判断和定位需求的辅助性数据;
摘要生成器,适于利用所述辅助性数据生成搜索结果的摘要,并呈现。
可选地,所述搜索器还适于:
将所述查询词与预先收集的地点类型的网页的URL进行匹配,将匹配到的一个或多个URL对应的网页作为与所述查询词相关的一个或多个网页,其中,所述网页的URL中包含地点信息。
可选地,所述数据提取器还适于:
确定满足地点类型判断和定位需求的一个或多个信息字段;
利用所述一个或多个信息字段,从所述一个或多个网页中提取出各个信息字段对应的字段值;
将所述各个信息字段及其对应的字段值作为所述辅助性数据。
可选地,所述数据提取器还适于:
从预先建立的网页数据提取模板库中,选取所述一个或多个网页各自对应的数据提取模板;
利用所述一个或多个网页各自对应的数据提取模板,从各个网页对应的文档内容中提取出满足地点类型判断和定位需求的辅助性数据。
可选地,所述装置还包括网页数据提取模板库生成器,适于:
收集多种页面类型的网页;
分析各种页面类型的网页,确定所述各种页面类型的网页对应的文档中的满足地点类型判断和定位需求的辅助性数据在文档中的位置信息;
记录所述各种页面类型的网页、所述各种页面类型的网页对应的文档中的满足地点类型判断和定位需求的辅助性数据在文档中的位置信息之间的对应关系,生成网页数据提取模板库。
可选地,所述网页数据提取模板库生成器还适于:
对大量网页的结构和/或主题进行分析,将具有相同结构和/或主题的网页划分为属于同一页面类型的网页。
可选地,若所述辅助性数据中包括电话号码,所述摘要生成器还适于:
获取存储有骚扰电话的黑名单库;
利用所述黑名单库对所述电话号码进行骚扰电话过滤;
利用过滤后的电话号码生成搜索结果的摘要。
可选地,所述摘要生成器还适于:
分析所述辅助性数据,确定能够对所述辅助性数据执行的操作;
生成所述操作对应的服务接口作为搜索结果的摘要。
可选地,所述装置还包括服务直达器,适于:
接收用户针对所述服务接口的触发指令,直达所述服务接口对应的服务。
可选地,所述装置还包括服务调起器,适于:
当接收到用户针对所述服务接口的触发指令时,调起服务;
显示所述服务的界面,以供所述用户进行服务项的选择。
可选地,所述服务接口的形式包括功能按键或链接。
可选地,所述摘要生成器还适于:将所述辅助性数据布局至预设组合样式中,生成搜索结果的摘要。
在本发明实施例中,当接收到来自用户的地点类型的查询词时,可以搜索与该查询词相关的一个或多个网页,随后从一个或多个网页中提取出满足地点类型判断和定位需求的辅助性数据,进而利用辅助性数据生成搜索结果的摘要,并呈现。由于辅助性数据满足地点类型判断和定位需求,将其作为搜索结果的摘要直接进行呈现,能够实现更加精准的结果对应用户查询词的需求,无需用户进一步点击搜索结果去查看并寻找自己需要的内容,从而帮助用户完成决策并缩短多次搜索的路径,快速地实现用户的地理位置寻址需求。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
根据下文结合附图对本发明具体实施例的详细描述,本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了现有技术中用户输入地点类型的查询词的搜索结果的示意图;
图2示出了根据本发明一实施例的搜索结果的摘要生成方法的流程图;
图3a示出了根据本发明实施例的用户输入地点类型的查询词的一种搜索结果的示意图;
图3b示出了根据本发明实施例的用户输入地点类型的查询词的另一种搜索结果的示意图;
图4示出了根据本发明一实施例的搜索结果的摘要生成装置的结构示意图;以及
图5示出了根据本发明另一实施例的搜索结果的摘要生成装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
如图1所示为现有技术中用户输入查询词“长春世界雕塑公园”得到的搜索结果的示意图,这里的查询词“长春世界雕塑公园”为地点类型的查询词。在图1的搜索结果的摘要中,词汇“长春世界雕塑公园”被添加了下划线,这里添加的下划线除了告知用户与查询词具有一定相关性之外,并没有任何信息,并且由于来自各个站点的站点名称、标题或摘要都差不多,这种情况在无法找回地图onebox的时候问题更加突出。通过对用户行为进行分析,用户在该查询词下会把每一条链接点开去查看并寻找自己需要的内容,花费大量的点击,用户成本十分高。
为解决上述技术问题,本发明实施例提供了一种搜索结果的摘要生成方法,该方法可以应用在智能手机、平板电脑、电视机、手表等智能终端上。图2示出了根据本发明一实施例的搜索结果的摘要生成方法的流程图。如图2所示,该方法至少包括以下步骤S202至步骤S206:
步骤S202,接收来自用户的地点类型的查询词,搜索与该查询词相关的一个或多个网页;
步骤S204,从一个或多个网页中提取出满足地点类型判断和定位需求的辅助性数据;
步骤S206,利用辅助性数据生成搜索结果的摘要,并呈现。
在本发明实施例中,当接收到来自用户的地点类型的查询词时,可以搜索与该查询词相关的一个或多个网页,随后从一个或多个网页中提取出满足地点类型判断和定位需求的辅助性数据,进而利用辅助性数据生成搜索结果的摘要,并呈现。由于辅助性数据满足地点类型判断和定位需求,将其作为搜索结果的摘要直接进行呈现,能够实现更加精准的结果对应用户查询词的需求,无需用户进一步点击搜索结果去查看并寻找自己需要的内容,从而帮助用户完成决策并缩短多次搜索的路径,快速地实现用户的地理位置寻址需求。
上文步骤S202中提及的地点类型,可以如“景点”、“饭店”、“公司”等地点类型,本发明对此不作限制。
进一步,步骤S202中的搜索与该查询词相关的一个或多个网页,本发明实施例提供了一种可选的方案,在该方案中,可以将查询词与预先收集的地点类型的网页的URL进行匹配,将匹配到的一个或多个URL对应的网页作为与该查询词相关的一个或多个网页,其中,网页的URL中包含地点信息。也就是说,在本发明实施例中,可以在线下预先收集地点类型的网页,该网页中的内容可以是对某一地点进行介绍、评分或点评等。进一步地,可以在该网页的URL中增加该地点的信息,从而在线上搜索时,可以直接将搜索查询词与预先收集的地点类型的网页的URL进行匹配,从而提高匹配的效率。
在步骤S202搜索与该查询词相关的一个或多个网页之后,步骤S204从一个或多个网页中提取出满足地点类型判断和定位需求的辅助性数据,这里的辅助性数据可以是地点的类型判断、评分、电话、具体地理位置、路线、周边同类地点等满足地点类型判断和定位需求的数据。此外,本发明实施例提供了多种实现步骤S204的方式,下面将分别进行详细介绍。
方式一,利用信息字段提取辅助性数据。即,确定满足地点类型判断和定位需求的一个或多个信息字段,进而利用一个或多个信息字段,从一个或多个网页中提取出各个信息字段对应的字段值,将各个信息字段及其对应的字段值作为辅助性数据。例如,需要从网页中提取某个地点的电话号码以及具体地理位置,则将“电话号码”以及“地址”作为信息字段,从而从网页中提取“电话号码”对应的值以及“地址”对应的值,将提取的值作为辅助性数据。
方式二,利用网页数据提取模板提取辅助性数据。即,从预先建立的网页数据提取模板库中,选取一个或多个网页各自对应的数据提取模板,进而利用一个或多个网页各自对应的数据提取模板,从各个网页对应的文档内容中提取出满足地点类型判断和定位需求的辅助性数据。
在本发明实施例中,由于不同类型的网页对应的数据提取模板有所不同,因而在预先建立网页数据提取模板库时,可以先收集多种页面类型的网页(如官网、论坛、博客等类型的网页),并对各种页面类型的网页进行分析,确定各种页面类型的网页对应的文档中的满足地点类型判断和定位需求的辅助性数据在文档中的位置信息。随后,记录各种页面类型的网页、各种页面类型的网页对应的文档中的满足地点类型判断和定位需求的辅助性数据在文档中的位置信息之间的对应关系,生成网页数据提取模板库。进一步,在本发明的可选实施例中,还可以对收集的大量网页的结构和/或主题进行分析,将具有相同结构和/或主题的网页划分为属于同一页面类型的网页。
以上方式一或方式二介绍了如何从一个或多个网页中提取出满足地点类型判断和定位需求的辅助性数据,在实际应用中,可以结合方式一和方式二进行辅助性数据的提取,本发明对此不作限制。
进一步地,在本发明的可选实施例中,为了提高辅助性数据的准确性和用户对其的认可度,在步骤S204从一个或多个网页中提取出满足地点类型判断和定位需求的辅助性数据之后,可以对辅助性数据进行智能判断和筛选。例如,当辅助性数据中包括电话号码时,可以首先获取存储有骚扰电话的黑名单库,利用黑名单库对该电话号码进行骚扰电话过滤,之后利用过滤后的电话号码生成搜索结果的摘要。又例如,当辅助性数据中包括地点的具体地理位置时,可以结合地图对该具体地理位置进行校验,当校验通过后将该具体地理位置生成搜索结果的摘要。
在本发明的另一可选实施例中,可以直接在搜索结果的摘要中提供相关服务的接口,即,可以分析辅助性数据,确定能够对辅助性数据执行的操作,生成操作对应的服务接口作为搜索结果的摘要,从而方便用户直达相应的服务。例如,当接收用户针对服务接口的触发指令时,直达服务接口对应的服务。又例如,当接收到用户针对服务接口的触发指令时,调起服务,并显示服务的界面,以供用户进行服务项的选择。这里的服务接口的形式可以是功能按键或链接,本发明不限于此。在实际应用中,如辅助性数据中包含具体地理位置,则可以将具体地理位置对应的地图接口作为搜索结果的摘要,从而用户一键即可导到地图得到出行路线。
在步骤S206中利用辅助性数据生成搜索结果的摘要,可以是将辅助性数据布局至预设组合样式中,生成搜索结果的摘要,从而用户更快地找到自己需要的全部信息。
在一个具体的应用中,当用户输入地点类型的查询词“长春世界雕塑公园”时,图3a示出了采用本发明实施例的搜索结果的摘要生成方法得到的搜索结果的示意图。在图3a中,搜索结果的摘要中展示了该景点的评分、电话、地址、路线、附近相同类型的景点等辅助性数据,从而实现更加精准的结果对应用户查询词的需求,而无需用户进一步点击搜索结果去查看并寻找自己需要的内容,从而帮助用户完成决策并缩短多次搜索的路径,快速地实现用户的地理位置寻址需求。并且,将具体地理位置对应的地图接口“点击查看路线”作为搜索结果的摘要,从而用户一键即可导到地图得到出行路线。
在另一个具体的应用中,当用户输入地点类型的查询词“北京红螺园饭店”时,图3b示出了采用本发明实施例的搜索结果的摘要生成方法得到的搜索结果的示意图。在图3b中,搜索结果的摘要中展示了该饭店的评分、地址、电话、路线、点评等辅助性数据,从而实现更加精准的结果对应用户查询词的需求。并且,将具体地理位置对应的地图接口“点击查看路线”作为搜索结果的摘要,从而用户一键即可导到地图得到出行路线。进一步,若用户在手机端进行搜索,当用户点击电话号码“010-666xxxx”时,可以直接调起手机端的拨号应用进行拨号。
需要说明的是,在实际应用中,上述所有可选实施方式可以采用结合的方式任意组合,形成本发明的可选实施例,在此不再一一赘述。
基于同一发明构思,本发明实施例还提供一种搜索结果的摘要生成装置,该装置可以应用在智能手机、平板电脑、电视机、手表等智能终端上。图4示出了根据本发明一实施例的搜索结果的摘要生成装置的结构示意图。参见图4,该装置至少可以包括:搜索器410、数据提取器420以及摘要生成器430。
现介绍本发明实施例的搜索结果的摘要生成装置的各组成或器件的功能以及各部分间的连接关系:
搜索器410,适于接收来自用户的地点类型的查询词,搜索与查询词相关的一个或多个网页;
数据提取器420,与搜索器410相耦合,适于从一个或多个网页中提取出满足地点类型判断和定位需求的辅助性数据;
摘要生成器430,与数据提取器420相耦合,适于利用辅助性数据生成搜索结果的摘要,并呈现。
本发明实施例提及的地点类型,可以如“景点”、“饭店”、“公司”等地点类型,本发明对此不作限制。
在本发明一实施例中,搜索器410还适于:
将查询词与预先收集的地点类型的网页的URL进行匹配,将匹配到的一个或多个URL对应的网页作为与查询词相关的一个或多个网页,其中,网页的URL中包含地点信息。
在本发明一实施例中,数据提取器420还适于:
确定满足地点类型判断和定位需求的一个或多个信息字段;
利用一个或多个信息字段,从一个或多个网页中提取出各个信息字段对应的字段值;
将各个信息字段及其对应的字段值作为辅助性数据。
在本发明一实施例中,数据提取器420还适于:
从预先建立的网页数据提取模板库中,选取一个或多个网页各自对应的数据提取模板;
利用一个或多个网页各自对应的数据提取模板,从各个网页对应的文档内容中提取出满足地点类型判断和定位需求的辅助性数据。
在本发明一实施例中,如图5所示,图4展示的装置还可以包括网页数据提取模板库生成器440,与数据提取器420相耦合,适于:
收集多种页面类型的网页;
分析各种页面类型的网页,确定各种页面类型的网页对应的文档中的满足地点类型判断和定位需求的辅助性数据在文档中的位置信息;
记录各种页面类型的网页、各种页面类型的网页对应的文档中的满足地点类型判断和定位需求的辅助性数据在文档中的位置信息之间的对应关系,生成网页数据提取模板库。
在本发明一实施例中,网页数据提取模板库生成器440还适于:
对大量网页的结构和/或主题进行分析,将具有相同结构和/或主题的网页划分为属于同一页面类型的网页。
在本发明一实施例中,若辅助性数据中包括电话号码,摘要生成器430还适于:
获取存储有骚扰电话的黑名单库;
利用黑名单库对电话号码进行骚扰电话过滤;
利用过滤后的电话号码生成搜索结果的摘要。
在本发明一实施例中,摘要生成器430还适于:
分析辅助性数据,确定能够对辅助性数据执行的操作;
生成操作对应的服务接口作为搜索结果的摘要。
在本发明一实施例中,如图5所示,图4展示的装置还可以包括服务直达器450,与摘要生成器430相耦合,适于:
接收用户针对服务接口的触发指令,直达服务接口对应的服务。
在本发明一实施例中,如图5所示,图4展示的装置还可以包括服务调起器460,与摘要生成器430相耦合,适于:
当接收到用户针对服务接口的触发指令时,调起服务;
显示服务的界面,以供用户进行服务项的选择。
在本发明一实施例中,服务接口的形式包括功能按键或链接。
在本发明一实施例中,摘要生成器430还适于:将辅助性数据布局至预设组合样式中,生成搜索结果的摘要。
根据上述任意一个优选实施例或多个优选实施例的组合,本发明实施例能够达到如下有益效果:
在本发明实施例中,当接收到来自用户的地点类型的查询词时,可以搜索与该查询词相关的一个或多个网页,随后从一个或多个网页中提取出满足地点类型判断和定位需求的辅助性数据,进而利用辅助性数据生成搜索结果的摘要,并呈现。由于辅助性数据满足地点类型判断和定位需求,将其作为搜索结果的摘要直接进行呈现,能够实现更加精准的结果对应用户查询词的需求,无需用户进一步点击搜索结果去查看并寻找自己需要的内容,从而帮助用户完成决策并缩短多次搜索的路径,快速地实现用户的地理位置寻址需求。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的搜索结果的摘要生成装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
至此,本领域技术人员应认识到,虽然本文已详尽示出和描述了本发明的多个示例性实施例,但是,在不脱离本发明精神和范围的情况下,仍可根据本发明公开的内容直接确定或推导出符合本发明原理的许多其他变型或修改。因此,本发明的范围应被理解和认定为覆盖了所有这些其他变型或修改。
本发明实施例的一方面提供了A1、一种搜索结果的摘要生成方法,包括:
接收来自用户的地点类型的查询词,搜索与所述查询词相关的一个或多个网页;
从所述一个或多个网页中提取出满足地点类型判断和定位需求的辅助性数据;
利用所述辅助性数据生成搜索结果的摘要,并呈现。
A2、根据A1所述的方法,其中,搜索与所述查询词相关的一个或多个网页,包括:
将所述查询词与预先收集的地点类型的网页的URL进行匹配,将匹配到的一个或多个URL对应的网页作为与所述查询词相关的一个或多个网页,其中,所述网页的URL中包含地点信息。
A3、根据A1或A2所述的方法,其中,从所述一个或多个网页中提取出满足地点类型判断和定位需求的辅助性数据,包括:
确定满足地点类型判断和定位需求的一个或多个信息字段;
利用所述一个或多个信息字段,从所述一个或多个网页中提取出各个信息字段对应的字段值;
将所述各个信息字段及其对应的字段值作为所述辅助性数据。
A4、根据A1-A3中任一项所述的方法,其中,从所述一个或多个网页中提取出满足地点类型判断和定位需求的辅助性数据,包括:
从预先建立的网页数据提取模板库中,选取所述一个或多个网页各自对应的数据提取模板;
利用所述一个或多个网页各自对应的数据提取模板,从各个网页对应的文档内容中提取出满足地点类型判断和定位需求的辅助性数据。
A5、根据A1-A4中任一项所述的方法,其中,还包括:
收集多种页面类型的网页;
分析各种页面类型的网页,确定所述各种页面类型的网页对应的文档中的满足地点类型判断和定位需求的辅助性数据在文档中的位置信息;
记录所述各种页面类型的网页、所述各种页面类型的网页对应的文档中的满足地点类型判断和定位需求的辅助性数据在文档中的位置信息之间的对应关系,生成网页数据提取模板库。
A6、根据A1-A5中任一项所述的方法,其中,通过以下步骤确定网页的页面类型:
对大量网页的结构和/或主题进行分析,将具有相同结构和/或主题的网页划分为属于同一页面类型的网页。
A7、根据A1-A6中任一项所述的方法,其中,若所述辅助性数据中包括电话号码,利用所述辅助性数据生成搜索结果的摘要,包括:
获取存储有骚扰电话的黑名单库;
利用所述黑名单库对所述电话号码进行骚扰电话过滤;
利用过滤后的电话号码生成搜索结果的摘要。
A8、根据A1-A7中任一项所述的方法,其中,利用所述辅助性数据生成搜索结果的摘要,包括:
分析所述辅助性数据,确定能够对所述辅助性数据执行的操作;
生成所述操作对应的服务接口作为搜索结果的摘要。
A9、根据A1-A8中任一项所述的方法,其中,还包括:
接收用户针对所述服务接口的触发指令,直达所述服务接口对应的服务。
A10、根据A1-A9中任一项所述的方法,其中,还包括:
当接收到用户针对所述服务接口的触发指令时,调起服务;
显示所述服务的界面,以供所述用户进行服务项的选择。
A11、根据A1-A10中任一项所述的方法,其中,所述服务接口的形式包括功能按键或链接。
A12、根据A1-A11中任一项所述的方法,其中,利用所述辅助性数据生成搜索结果的摘要,包括:
将所述辅助性数据布局至预设组合样式中,生成搜索结果的摘要。
本发明实施例的另一方面提供了B13、一种搜索结果的摘要生成装置,包括:
搜索器,适于接收来自用户的地点类型的查询词,搜索与所述查询词相关的一个或多个网页;
数据提取器,适于从所述一个或多个网页中提取出满足地点类型判断和定位需求的辅助性数据;
摘要生成器,适于利用所述辅助性数据生成搜索结果的摘要,并呈现。
B14、根据B13所述的装置,其中,所述搜索器还适于:
将所述查询词与预先收集的地点类型的网页的URL进行匹配,将匹配到的一个或多个URL对应的网页作为与所述查询词相关的一个或多个网页,其中,所述网页的URL中包含地点信息。
B15、根据B13或B14所述的装置,其中,所述数据提取器还适于:
确定满足地点类型判断和定位需求的一个或多个信息字段;
利用所述一个或多个信息字段,从所述一个或多个网页中提取出各个信息字段对应的字段值;
将所述各个信息字段及其对应的字段值作为所述辅助性数据。
B16、根据B13-B15中任一项所述的装置,其中,所述数据提取器还适于:
从预先建立的网页数据提取模板库中,选取所述一个或多个网页各自对应的数据提取模板;
利用所述一个或多个网页各自对应的数据提取模板,从各个网页对应的文档内容中提取出满足地点类型判断和定位需求的辅助性数据。
B17、根据B13-B16中任一项所述的装置,其中,还包括网页数据提取模板库生成器,适于:
收集多种页面类型的网页;
分析各种页面类型的网页,确定所述各种页面类型的网页对应的文档中的满足地点类型判断和定位需求的辅助性数据在文档中的位置信息;
记录所述各种页面类型的网页、所述各种页面类型的网页对应的文档中的满足地点类型判断和定位需求的辅助性数据在文档中的位置信息之间的对应关系,生成网页数据提取模板库。
B18、根据B13-B17中任一项所述的装置,其中,所述网页数据提取模板库生成器还适于:
对大量网页的结构和/或主题进行分析,将具有相同结构和/或主题的网页划分为属于同一页面类型的网页。
B19、根据B13-B18中任一项所述的装置,其中,若所述辅助性数据中包括电话号码,所述摘要生成器还适于:
获取存储有骚扰电话的黑名单库;
利用所述黑名单库对所述电话号码进行骚扰电话过滤;
利用过滤后的电话号码生成搜索结果的摘要。
B20、根据B13-B19中任一项所述的装置,其中,所述摘要生成器还适于:
分析所述辅助性数据,确定能够对所述辅助性数据执行的操作;
生成所述操作对应的服务接口作为搜索结果的摘要。
B21、根据B13-B20中任一项所述的装置,其中,还包括服务直达器,适于:
接收用户针对所述服务接口的触发指令,直达所述服务接口对应的服务。
B22、根据B13-B21中任一项所述的装置,其中,还包括服务调起器,适于:
当接收到用户针对所述服务接口的触发指令时,调起服务;
显示所述服务的界面,以供所述用户进行服务项的选择。
B23、根据B13-B22中任一项所述的装置,其中,所述服务接口的形式包括功能按键或链接。
B24、根据B13-B23中任一项所述的装置,其中,所述摘要生成器还适于:将所述辅助性数据布局至预设组合样式中,生成搜索结果的摘要。
Claims (10)
1.一种搜索结果的摘要生成方法,包括:
接收来自用户的地点类型的查询词,搜索与所述查询词相关的一个或多个网页;
从所述一个或多个网页中提取出满足地点类型判断和定位需求的辅助性数据;
利用所述辅助性数据生成搜索结果的摘要,并呈现。
2.根据权利要求1所述的方法,其中,搜索与所述查询词相关的一个或多个网页,包括:
将所述查询词与预先收集的地点类型的网页的URL进行匹配,将匹配到的一个或多个URL对应的网页作为与所述查询词相关的一个或多个网页,其中,所述网页的URL中包含地点信息。
3.根据权利要求1或2所述的方法,其中,从所述一个或多个网页中提取出满足地点类型判断和定位需求的辅助性数据,包括:
确定满足地点类型判断和定位需求的一个或多个信息字段;
利用所述一个或多个信息字段,从所述一个或多个网页中提取出各个信息字段对应的字段值;
将所述各个信息字段及其对应的字段值作为所述辅助性数据。
4.根据权利要求1-3中任一项所述的方法,其中,从所述一个或多个网页中提取出满足地点类型判断和定位需求的辅助性数据,包括:
从预先建立的网页数据提取模板库中,选取所述一个或多个网页各自对应的数据提取模板;
利用所述一个或多个网页各自对应的数据提取模板,从各个网页对应的文档内容中提取出满足地点类型判断和定位需求的辅助性数据。
5.根据权利要求1-4中任一项所述的方法,其中,还包括:
收集多种页面类型的网页;
分析各种页面类型的网页,确定所述各种页面类型的网页对应的文档中的满足地点类型判断和定位需求的辅助性数据在文档中的位置信息;
记录所述各种页面类型的网页、所述各种页面类型的网页对应的文档中的满足地点类型判断和定位需求的辅助性数据在文档中的位置信息之间的对应关系,生成网页数据提取模板库。
6.根据权利要求1-5中任一项所述的方法,其中,通过以下步骤确定网页的页面类型:
对大量网页的结构和/或主题进行分析,将具有相同结构和/或主题的网页划分为属于同一页面类型的网页。
7.根据权利要求1-6中任一项所述的方法,其中,若所述辅助性数据中包括电话号码,利用所述辅助性数据生成搜索结果的摘要,包括:
获取存储有骚扰电话的黑名单库;
利用所述黑名单库对所述电话号码进行骚扰电话过滤;
利用过滤后的电话号码生成搜索结果的摘要。
8.根据权利要求1-7中任一项所述的方法,其中,利用所述辅助性数据生成搜索结果的摘要,包括:
分析所述辅助性数据,确定能够对所述辅助性数据执行的操作;
生成所述操作对应的服务接口作为搜索结果的摘要。
9.根据权利要求1-8中任一项所述的方法,其中,还包括:
接收用户针对所述服务接口的触发指令,直达所述服务接口对应的服务。
10.一种搜索结果的摘要生成装置,包括:
搜索器,适于接收来自用户的地点类型的查询词,搜索与所述查询词相关的一个或多个网页;
数据提取器,适于从所述一个或多个网页中提取出满足地点类型判断和定位需求的辅助性数据;
摘要生成器,适于利用所述辅助性数据生成搜索结果的摘要,并呈现。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610202496.XA CN105893570A (zh) | 2016-03-31 | 2016-03-31 | 搜索结果的摘要生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610202496.XA CN105893570A (zh) | 2016-03-31 | 2016-03-31 | 搜索结果的摘要生成方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105893570A true CN105893570A (zh) | 2016-08-24 |
Family
ID=57013302
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610202496.XA Pending CN105893570A (zh) | 2016-03-31 | 2016-03-31 | 搜索结果的摘要生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105893570A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101128824A (zh) * | 2004-12-30 | 2008-02-20 | 谷歌公司 | 位置提取 |
CN101350013A (zh) * | 2007-07-18 | 2009-01-21 | 北京灵图软件技术有限公司 | 一种地理信息的搜索方法和系统 |
CN103425655A (zh) * | 2012-05-16 | 2013-12-04 | 腾讯科技(深圳)有限公司 | 基于位置服务的场馆信息搜索方法和装置 |
US20150286721A1 (en) * | 2014-04-04 | 2015-10-08 | Eugene Voronov | System and Method for Returning Precise Internet Search Results |
-
2016
- 2016-03-31 CN CN201610202496.XA patent/CN105893570A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101128824A (zh) * | 2004-12-30 | 2008-02-20 | 谷歌公司 | 位置提取 |
CN101350013A (zh) * | 2007-07-18 | 2009-01-21 | 北京灵图软件技术有限公司 | 一种地理信息的搜索方法和系统 |
CN103425655A (zh) * | 2012-05-16 | 2013-12-04 | 腾讯科技(深圳)有限公司 | 基于位置服务的场馆信息搜索方法和装置 |
US20150286721A1 (en) * | 2014-04-04 | 2015-10-08 | Eugene Voronov | System and Method for Returning Precise Internet Search Results |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103473230B (zh) | 服务范围确定方法、物流服务提供方推荐方法及相应装置 | |
CN103902674B (zh) | 特定主题的评论数据的采集方法和装置 | |
CN104143005B (zh) | 一种相关搜索系统及方法 | |
CN104090976B (zh) | 搜索引擎爬虫抓取网页的方法及装置 | |
CN104572956B (zh) | 确定poi信息有效性的系统及方法 | |
CN102904941B (zh) | 一种网络访问速度信息的处理、显示的方法和装置 | |
CN106445963B (zh) | App平台的广告索引关键词自动生成方法和装置 | |
CN104050286B (zh) | 一种提供搜索结果整合的方法和装置 | |
CN105975537A (zh) | 一种应用程序的排序方法及装置 | |
CN104572955A (zh) | 一种基于聚类确定poi名称的系统及方法 | |
CN106202294A (zh) | 基于关键词和主题模型融合的相关新闻计算方法及装置 | |
CN108319376A (zh) | 一种优化商业词推广的输入联想推荐方法及装置 | |
CN103777980A (zh) | 一种加载网站点评信息的方法和浏览器 | |
CN103366007A (zh) | 基于地理位置的搜索方法及装置 | |
CN102855309A (zh) | 一种基于用户行为关联分析的信息推荐方法及装置 | |
CN103942264B (zh) | 推送包含新闻信息的网页的方法和装置 | |
CN102902796B (zh) | 浏览器网页标签自动分组系统及方法 | |
CN106155769A (zh) | 一种工作流处理方法、装置及工作流引擎 | |
CN102902788B (zh) | 浏览器网页标签自动分组系统及方法 | |
CN108170293A (zh) | 输入联想的个性化推荐方法及装置 | |
CN106611065A (zh) | 搜索方法和装置 | |
CN105516114B (zh) | 一种基于网页哈希值扫描漏洞的方法、装置及电子设备 | |
CN105096138A (zh) | 实现o2o对话交互的方法和装置 | |
CN106332016A (zh) | 一种wifi设备的关联方法和装置 | |
CN106126588A (zh) | 提供相关词的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160824 |
|
RJ01 | Rejection of invention patent application after publication |