CN106547748A - 一种app索引库的创建方法及装置、搜索app的方法及装置 - Google Patents
一种app索引库的创建方法及装置、搜索app的方法及装置 Download PDFInfo
- Publication number
- CN106547748A CN106547748A CN201510590959.XA CN201510590959A CN106547748A CN 106547748 A CN106547748 A CN 106547748A CN 201510590959 A CN201510590959 A CN 201510590959A CN 106547748 A CN106547748 A CN 106547748A
- Authority
- CN
- China
- Prior art keywords
- app
- information
- word
- search
- alternative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种APP索引库的创建方法及装置、搜索APP的方法及装置,该APP索引库的创建方法包括:获取与第一APP相关的基本信息和隐含信息,其中,基本信息包括第一APP的提供商提供的对第一APP的基本介绍信息,隐含信息包括用户对第一APP的评论信息;分别建立基本信息、隐含信息与第一APP的索引关系,并保存在索引库中。本发明的方案,将获取的用户对APP的评论信息添加到索引库中,解决了目前APP搜索只能针对名称、关键词、简介等少数字段进行搜索的问题,满足用户的更多搜索需求。
Description
技术领域
本发明涉及应用程序(Application,APP)搜索技术领域,尤其涉及一种APP索引库的创建方法及装置、搜索APP的方法及装置。
背景技术
在移动互联网蓬勃发展的今天,各种手机APP已经成为用户必不可少的工具。如何让用户更方便的搜索到想要的APP,已经成为APP应用商店的首要任务之一。目前,各个APP平台为了吸引用户,方便用户获取想要的APP,纷纷优化APP搜索功能。其中,各大APP商店针对APP的搜索,主要是利用APP开发者提供商提供的APP名称、关键词、简介、分类等几个基本的字段描述进行搜索,其搜索能力仍然非常的有限。
例如:用户想搜索能查手机话费余额的APP,虽然中国移动官方有APP,能够查询手机话费余额,但描述中没有具体描述能查话费,因此目前的搜索方法无法解决这类问题,即无法在用户只知道自己的需求,而不知道所要下载的APP的名称的情况下,搜索出用户所需要的APP。
发明内容
为了克服现有技术中存在的上述问题,本发明实施例提供了一种APP索引库的创建方法及装置、搜索APP的方法及装置,将获取的用户对APP的评论信息添加到索引库中,解决了目前APP搜索只能针对名称、关键词、简介等少数字段进行搜索的问题,满足了用户的更多搜索需求。
为了解决上述技术问题,本发明采用如下技术方案:
依据本发明实施例的一个方面,提供了一种应用程序APP索引库的创建方法,包括:
获取与第一APP相关的基本信息和隐含信息,其中,所述基本信息包括所述第一APP的提供商提供的对所述第一APP的基本介绍信息,所述隐含信息包括用户对所述第一APP的评论信息;
分别建立所述基本信息、所述隐含信息与所述第一APP的索引关系,并保存在索引库中。
其中,上述方案中,所述获取与第一APP相关的基本信息和隐含信息的步骤之后,所述方法还包括:
从所述隐含信息中提取情感词;
依据所述情感词确定用户对所述第一APP的评价结果。
其中,上述方案中,所述获取与第一APP相关的基本信息和隐含信息的步骤之后,所述方法还包括:
从所述隐含信息中提取实体词,所述实体词和所述情感词是依据对所述隐含信息进行分词处理后获得的词语和预先存储的实体词库和情感词库确定的。
其中,上述方案中,所述依据所述情感词确定用户对所述第一APP的评价结果的步骤包括:
统计所述情感词的总数量n,所述情感词中属于正面评价的情感词的数量x,以及所述情感词中属于负面评价的情感词的数量y,其中,n,x和y均为整数;
当x/n超过预定阈值时,所述第一APP的评价结果为正面评价;
当y/n超过预定阈值时,所述第一APP的评价结果为负面评价。
其中,上述方案中,所述获取与第一APP相关的基本信息和隐含信息的步骤包括:
通过爬虫技术搜集与所述第一APP相关的基本信息;
通过爬虫技术抓取与所述第一APP相关的网页,并通过预定模板对所述网页上的内容进行解析,获取所述隐含信息。
其中,上述方案中,所述索引库包括第一子库、第二子库和第三子库,所述分别建立所述基本信息、所述隐含信息与所述第一APP的索引关系,并保存在索引库中的步骤包括:
建立所述基本信息与所述第一APP之间的索引关系,并保存在所述第一子库中;
建立所述隐含信息与所述第一APP之间的索引关系,并保存在所述第二子库中;
分别建立所述实体词和所述评价结果与所述第一APP之间的索引关系,并保存在所述第三子库中。
依据本发明实施例的另一个方面,还提供了一种搜索应用程序APP的方法,包括:
获取用户输入的搜索信息;
在预存的基本信息和与APP之间的索引关系,以及隐含信息与APP之间的索引关系中,查找与所述搜索信息相匹配的第一基本信息和第一隐含信息,并将所述第一基本信息和所述第一隐含信息对应的APP作为备选APP,其中,所述基本信息包括所述APP的提供商提供的对所述APP的基本介绍信息,所述隐含信息包括用户对所述APP的评论信息;
获取所述备选PP的基本信息,并显示给用户。
其中,上述方案中,所述在预存的基本信息与APP之间的索引关系,以及隐含信息与APP之间的索引关系中,查找与所述搜索信息相匹配的第一基本信息和第一隐含信息,并将所述第一基本信息和所述第一隐含信息相对应的APP作为备选APP的步骤包括:
对所述搜索信息进行分词处理,获得所述搜索信息包括的词语;
依据所述搜索信息包括的词语,在预存的所述基本信息与APP之间的索引关系中,查找与所述搜索信息相匹配的第一基本信息;
当查找到所述第一基本信息时,获取与所述第一基本信息相对应的APP,并作为第一备选APP保存;
依据所述搜索信息包括的词语,在预存的所述隐含信息与APP的索引关系中,查找与所述搜索信息相匹配的第一隐含信息;
当查找到所述第一隐含信息时,获取与所述第一隐含信息相对应的APP,并作为第二备选APP保存。
其中,上述方案中,所述获取用户输入的搜索信息的步骤之后,所述方法还包括:
从所述搜索信息中提取所述搜索信息的第一实体词;
依据所述第一实体词,在预存的从所述隐含信息中提取的实体词与APP之间的索引关系中,查找与所述搜索信息相匹配的实体词,并当查找到时,获取与所述搜索信息相匹配的实体词相对应的APP,并作为第三备选APP保存。
其中,上述方案中,所述当查找到时,获取与所述搜索信息相匹配的实体词相对应的APP之后,所述方法还包括:
从所述搜索信息中提取第一情感词,并当所述第一情感词属于正面评价时,在所述第三备选APP中,依据预存的评价结果与APP之间的索引关系,查找评价结果为正面评价的APP,并在查找到时,作为第四备选APP保存;当所述第一情感词属于负面评价时,在所述第三备选APP中,依据预存的所述评价结果与APP之间的索引关系,查找评价结果为负面评价的APP,并在查找到时,作为第五备选APP保存,其中,所述评价结果是依据从所述隐含信息中提取的情感词确定的。
其中,上述方案中,所述获取所述备选APP的基本信息,并显示给用户的步骤包括:
分别获取第一备选APP、第二备选APP、第三备选APP、第四备选APP以及第五备选APP的基本信息;
按照第一备选APP、第三备选APP、第四备选APP、第五备选APP、第二备选APP的顺序,将所述基本信息显示给用户;或者
当所述第一备选APP、第二备选APP、第三备选APP、第四备选APP以及第五备选APP中存在相同的APP时,将相同APP的基本信息显示给用户。
依据本发明实施例的另一个方面,还提供了一种应用程序APP索引库的创建装置,包括:
第一获取模块,用于获取与第一APP相关的基本信息和隐含信息,其中,所述基本信息包括所述第一APP的提供商提供的对所述第一APP的基本介绍信息,所述隐含信息包括用户对所述第一APP的评论信息;
建立模块,用于分别建立所述基本信息、所述隐含信息与所述第一APP的索引关系,并保存在索引库中。
其中,上述方案中,所述装置还包括:
第一提取模块,用于从所述隐含信息中提取情感词;
确定模块,用于依据所述情感词确定用户对所述第一APP的评价结果。
其中,上述方案中,所述装置还包括:
第二提取模块,用于所述隐含信息中提取实体词,所述实体词和所述情感词是依据对所述隐含信息进行分词处理后获得的词语和预先存储的实体词库和情感词库确定的。
其中,上述方案中,所述确定模块包括:
统计单元,用于统计所述情感词的总数量n,所述情感词中属于正面评价的情感词的数量x,以及所述情感词中属于负面评价的情感词的数量y,其中,n,x和y均为整数;
第一确定单元,用于当x/n超过预定阈值时,所述第一APP的评价结果为正面评价;
第二确定单元,用于当y/n超过预定阈值时,所述第一APP的评价结果为负面评价。
其中,上述方案中,所述第一获取模块包括:
基本信息获取单元,用于通过爬虫技术搜集与所述第一APP相关的基本信息;
隐含信息获取单元,用于通过爬虫技术抓取与所述第一APP相关的网页,并通过预定模板对所述网页上的内容进行解析,获取所述隐含信息。
其中,上述方案中,所述索引库包括第一子库、第二子库和第三子库,所述建立模块包括:
第一建立单元,用于建立所述基本信息与所述第一APP之间的索引关系,并保存在所述第一子库中;
第二建立单元,用于建立所述隐含信息与所述第一APP之间的索引关系,并保存在所述第二子库中;
第三建立单元,用于分别建立所述实体词和所述评价结果与所述第一APP之间的索引关系,并保存在所述第三子库中。
依据本发明实施例的另一个方面,还提供了一种搜索应用程序APP的装置,包括:
第二获取模块,用于获取用户输入的搜索信息;
第一搜索模块,用于在预存的基本信息和与APP之间的索引关系,以及隐含信息与APP之间的索引关系中,查找与所述搜索信息相匹配的第一基本信息和第一隐含信息,并将所述第一基本信息和所述第一隐含信息对应的APP作为备选APP,其中,所述基本信息包括所述APP的提供商提供的对所述APP的基本介绍信息,所述隐含信息包括用户对所述APP的评论信息;
显示模块,用于获取所述备选APP的基本信息,并显示给用户。
其中,上述方案中,所述第一搜索模块包括:
处理单元,用于对所述搜索信息进行分词处理,获得所述搜索信息包括的词语;
第一查找单元,用于依据所述搜索信息包括的词语,在预存的所述基本信息与APP之间的索引关系中,查找与所述搜索信息相匹配的第一基本信息;
第一记录单元,用于当查找到所述第一基本信息时,获取与所述第一基本信息相对应的APP,并作为第一备选APP保存;
第二查找单元,用于依据所述搜索信息包括的词语,在预存的所述隐含信息与APP之间的索引关系中,查找与所述搜索信息相匹配的第一隐含信息;
第二记录单元,用于当查找到所述第一隐含信息时,获取与所述第一隐含信息相对应的APP,并作为第二备选APP保存。
其中,上述方案中,所述装置还包括:
第三提取模块,用于从所述搜索信息中提取所述搜索信息的第一实体词;
第二搜索模块,用于依据所述第一实体词,在在预存的从所述隐含信息中提取的实体词与APP的索引关系中,中查找与所述搜索信息相匹配的实体词,并当查找到时,获取与所述搜索信息相匹配的实体词相对应的APP,并作为第三备选APP保存。
其中,上述方案中,所述装置还包括:
第三搜索单元,用于从所述搜索信息中提取第一情感词,并当所述第一情感词属于正面评价时,在所述第三备选APP中,依据预存的评价结果与APP之间的索引关系,查找评价结果为正面评价的APP,并在查找到时,作为第四备选APP保存;当所述第一情感词属于负面评价时,在所述第三备选APP中,依据预存的所述评价结果与APP之间的索引关系,查找评价结果为负面评价的APP,并在查找到时,作为第五备选APP保存,,其中,所述评价结果是依据从所述隐含信息中提取的情感词确定的。
其中,上述方案中,所述显示模块包括:
第二获取单元,用于分别获取第一备选APP、第二备选APP、第三备选APP、第四备选APP以及第五备选APP的基本信息;
显示单元,用于按照第一备选APP、第三备选APP、第四备选APP、第五备选APP、第二备选APP的顺序,将所述基本信息显示给用户;或者,当所述第一备选APP、第二备选APP、第三备选APP、第四备选APP以及第五备选APP中存在相同的APP时,将相同APP的基本信息显示给用户。
本发明实施例的有益效果是:
本发明实施例的应用程序APP索引库的创建方法,将APP的基本信息和隐含信息都添加到索引库中,并分别建立基本信息和隐含信息与APP之间的索引关系,使得用户在输入搜索信息后,能够在该索引库中查找与搜索信息相匹配的基本信息和隐含信息,并在查找到后,向用户显示相对应的APP,满足了用户的不同搜索需求,使得用户即使不知道自己所要下载的APP名称,仅仅依据自己的需求就可查找到相匹配的APP,并且使查找到的APP与用户需求的匹配度更高。
附图说明
图1表示本发明实施例的应用程序APP索引库的创建方法流程图;
图2表示本发明实施例的应用程序搜索APP的方法流程图;
图3表示本发明实施例的应用程序APP索引库的创建装置结构框图;
图4表示本发明实施例的确定模块的结构框图;
图5表示本发明实施例的第一获取模块的结构框图;
图6表示本发明实施例的建立模块的结构框图;
图7表示本发明实施例的搜索应用程序APP的装置的结构框图;
图8表示本发明实施例的第一搜索模块的结构框图;
图9表示本发明实施例的显示模块的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
实施例一
依据本发明实施例的一个方面,提供了一种应用程序APP索引库的创建方法,该方法首先,获取与第一APP相关的基本信息和隐含信息;接着,分别建立所述基本信息、所述隐含信息与所述第一APP的索引关系,并保存在索引库中。
通过本发明实施例的应用程序APP索引库的创建方法创建的索引库,不仅包括所述第一APP的提供商提供的对所述第一APP的基本介绍信息,还包括了用户对所述第一APP的评论信息,即隐含信息,以及基本信息和隐含信息与所述第一APP之间的索引关系,为用户提供了更多的搜索依据,使得用户即使不知道自己所要下载的APP的名称,仅仅通过自己的需求就可从索引库中查找到相应的APP,提升了用户使用体验。
如图1所示,所述方法包括:
步骤S11、获取与第一APP相关的基本信息和隐含信息。
其中,所述基本信息包括所述第一APP的提供商提供的对所述第一APP的基本介绍信息,所述隐含信息包括用户对所述第一APP的评论信息。具体地,第一APP的基本信息可包括第一APP的名称、内容提要、新功能、开发商、开发者、类别、版本、大小、兼容性要求、年龄限制等。第一APP的隐含信息可包括各大APP商城中用户对第一APP的评论数据、APP论坛的用户交流讨论以及用户对第一APP的使用说明数据等。当然,可以理解的是,对于基本信息和隐含信息包括的具体内容,并不局限于此。
其中,对于基本信息和隐含信息和通过爬虫技术获取,具体地:
通过爬虫技术搜集与所述第一APP相关的基本信息;
通过爬虫技术抓取与所述第一APP相关的网页,并通过预定模板对所述网页上的内容进行解析,获取所述隐含信息。
对于所述基本信息,由于是第一APP的提供商提供的对第一APP的基本介绍信息,且所述基本信息在APP商城的相应网页均按照各个字段显示,所以获取的过程中,不会掺杂过多的不相关信息,因而只需通过简单的爬虫技术抓取即可获得。
然而,在APP论坛上,用户对各个APP的评论纷繁复杂,因而在通过爬虫技术抓取与第一APP相关的网页后,还需要通过该网页的预定模块对网页上的内容进行解析,从而获得该网页上针对第一APP的评论信息,即隐含信息。
进一步地,为了使得用户在搜索所需APP的过程中更加具有针对性,或加快搜索速度,可对获取的隐含信息进行处理,即从所述隐含信息中提取实体词和情感词。具体地,首先对隐含信息进行分词处理,获取隐含信息包括的词语,然后,依据预先存储的实体词库和情感词库,判断这些词语中哪些词语属于实体词,哪些词语属于情感词。
具体地,举例来说,如表1和表2所示:
表1:隐含信息与实体词对应表
其中,表1中APP1属于游戏类的APP,用户比较关心时间、地点、人物(角色)等信息。因此,可提取出用户评论中的这些信息。APP2和APP3属于服务类的APP,其主要功能是提供一些服务信息的查询,解决用户的实际问题。因此,针对APP2和APP3的隐含信息可提取关于功能介绍的实体词。
表2:隐含信息与情感词对应表
另外,由于各个用户针对同一APP具有不同的评价,某些用户可能认为该APP很好使用,然而,某些用户可能认为该APP难以使用,因此针对同一APP,获取的隐含信息中包括的情感词也会包括正面评价的情感词和负面评价的情感词,如表2所示,对于同一APP具有正反两方面的评价。所以,为了能够进一步确定该APP最终属于好评的APP还是差评的APP,可以依据情感词确定APP的评价结果。
具体地,当获得第一APP的情感词后,统计所述情感词的总数量n,所述情感词中属于正面评价的情感词的数量x,以及所述情感词中属于负面评价的情感词的数量y,其中,n,x和y均为整数;当x/n超过预定阈值时,所述第一APP的评价结果为正面评价;当y/n超过预定阈值时,所述第一APP的评价结果为负面评价。
此外,实体词和情感词的提取还具有两方面的作用:第一、APP提供商提供的信息一般都不包括这些信息,把这些放到索引中,能有效的补充APP的信息,满足更全面的搜素需求。第二,用来用户意图识别,分析用户的查询是哪一类查询。
步骤S13、分别建立所述基本信息、所述隐含信息与所述第一APP的索引关系,并保存在索引库中。
其中,索引库包括第一子库、第二子库和第三子库,具体地,步骤S13包括:
建立所述基本信息与所述第一APP之间的索引关系,并保存在所述第一子库中;
建立所述隐含信息与所述第一APP之间的索引关系,并保存在所述第二子库中;
分别建立所述实体词和所述评价结果与所述第一APP之间的索引关系,并保存在所述第三子库中。
其中,建立索引使用的主要技术就是通用搜索引擎的倒排索引技术,使得当用户输入一个查询依据时,可以返回包含这个查询依据的文档。
按照上述方法,将基本信息、隐含信息、实体词和评价结果与APP的索引关系,分别存储在不同的子库中,使得在根据用户的搜索要求进行搜索时,三个子库可分别进行,避免了将所有索引关系存储在同一个库中产生重复搜索的问题,节省了搜索时间,提升了用户使用体验。
实施例二
依据本发明实施例的另一个方面,还提供了一种应用程序搜索APP的方法,该方法首先,获取用户输入的搜索信息;接着,在预存的基本信息和与APP之间的索引关系,以及隐含信息与APP之间的索引关系中,查找与所述搜索信息相匹配的第一基本信息和第一隐含信息,并将所述第一基本信息和所述第一隐含信息对应的APP作为备选APP,最后,获取所述备选APP的基本信息,并显示给用户。
本发明实施例的应用程序搜索APP的方法,能够在用户不知道自己所要下载的APP名称时,仅仅根据自己的需求就可获得相应的APP。
如图2所示,所述方法包括:
步骤S21、获取用户输入的搜索信息。
步骤S23、在预存的基本信息和与APP之间的索引关系,以及隐含信息与APP之间的索引关系中,查找与所述搜索信息相匹配的第一基本信息和第一隐含信息,并将所述第一基本信息和所述第一隐含信息对应的APP作为备选APP。
其中,所述基本信息包括所述APP的提供商提供的对所述APP的基本介绍信息,所述隐含信息包括用户对所述APP的评论信息。
具体地,APP的基本信息可包括APP的名称、内容提要、新功能、开发商、开发者、类别、版本、大小、兼容性要求、年龄限制等。APP的隐含信息可包括各大APP商城中用户对第二APP的评论数据、APP论坛的用户交流讨论以及用户对第二APP的使用说明数据等。当然,可以理解的是,对于基本信息和隐含信息包括的具体内容,并不局限于此。
进一步地,步骤S23包括:
对所述搜索信息进行分词处理,获得所述搜索信息包括的词语;
依据所述搜索信息包括的词语,在预存的所述基本信息与APP之间的索引关系中,查找与所述搜索信息相匹配的第一基本信息;
当查找到所述第一基本信息时,获取与所述第一基本信息相对应的APP,并作为第一备选APP保存;
依据所述搜索信息包括的词语,在预存的所述隐含信息与APP之间的索引关系中,查找与所述搜索信息相匹配的第一隐含信息;
当查找到所述第一隐含信息时,获取与所述第一隐含信息相对应的APP,并作为第二备选APP保存。
进一步地,在步骤S21之后,所述方法还包括:
从所述搜索信息中提取所述搜索信息的第一实体词;
依据所述第一实体词,在预存的从所述隐含信息中提取的实体词与APP之间的索引关系中,查找与所述搜索信息相匹配的实体词,并当查找到时,获取与所述搜索信息相匹配的实体词相对应的APP,并作为第三备选APP保存。
进一步地,所述当查找到时,获取与所述搜索信息相匹配的实体词相对应的APP之后,所述方法还包括:
从所述搜索信息中提取第一情感词,并当所述第一情感词属于正面评价时,在所述第三备选APP中,依据预存的评价结果与APP之间的索引关系,查找评价结果为正面评价的APP,并在查找到时,作为第四备选APP保存;
当所述第一情感词属于负面评价时,在所述第三备选APP中,依据预存的所述评价结果与APP之间的索引关系,查找评价结果为负面评价的APP,并在查找到时,作为第五备选APP保存,其中,所述评价结果是依据从所述隐含信息中提取的情感词确定的。
进一步地,本发明实施例的搜索APP的方法,可依据用户输入的搜索信息,在索引库中进行搜索。其中,该索引库可包括第一子库、第二子库、第三子库,则第一子库中存储有基本信息与第二APP的索引关系,第二子库中存储有隐含信息与第二APP的索引关系,第三子库中存储有实体词和评价结果与第二APP的索引关系。因此,当通过步骤S21获得用户的搜索信息后,可分别从第一子库、第二子库和第三子库中进行搜索,以获取与搜索信息相匹配的第二APP,可以节省搜索时间,提升用户使用体验。
当然,对于在上述三个子库中进行的搜索,还可设置一个优先级,例如首先在第一子库中搜索,当搜索到满足用户需求的APP时,可停止搜索,即不再在第二子库和第三子库中搜索;当在第一子库中未搜索到时,可接着在存储有实体词的第三子库中进行搜索(因为实体词的搜索范围比全部隐含信息的搜索范围小,可进一步缩短搜索时间),当在第三子库中搜索到满足用户需求的APP时,停止搜索,即不再在第二子库中搜索;当在第三子库中仍未搜索到时,可继续在第二子库中进行搜索。
或者,可在三个子库中均进行搜索,进而为用户返回更多的搜索结果,为用户提供更多的选择。
步骤S25、获取所述备选APP的基本信息,并显示给用户。
当在第一子库、第二子库和第三子库中均进行搜索后,可分别获取第一备选APP、第二备选APP、第三备选APP、第四备选APP以及第五备选APP的基本信息,然后,按照第一备选APP、第三备选APP、第四备选APP、第五备选APP、第二备选APP的顺序,将所述基本信息显示给用户。
其中,可能存在所述第一备选APP、第二备选APP、第三备选APP、第四备选APP以及第五备选APP中存在相同的APP,因为相同部分的APP更加符合用户的搜索需求,所以,可只将相同的APP的基本信息显示给用户。
具体地,举例来说:假设用户输入的搜索信息为“哪款APP能查话费”时:
步骤101:对该搜索信息进行分词处理,得到“哪款APP能查话费”这些词语;
步骤102:在第一子库中,依据步骤101中获得的词语,查找与搜索信息“哪款APP能查话费”相匹配的基本信息,进而根据基本信息与APP的索引关系找到相应的APP,若从第一子库中,查找到一个叫做“话费达人”的APP,则将该APP作为一个备选APP保存;
步骤103:从搜索信息“哪款APP能查话费”中提取第一实体词“查话费”,然后在第三子库中查找含有“查话费”的APP,若找到名为“北京移动服务(官方)”的APP,则将该APP作为另一备选APP保存;
步骤104:当然,还可继续从第二子库中的隐含信息中搜索,获得更多的备选APP;
步骤105:根据上述步骤中获取的备选APP,按照获取的先后顺序进行排序,返回给用户显示。
另外,若用户输入的搜索信息为“哪款APP能方便查话费”,可以看出该搜索信息比上述举例中增加了一个情感词“方便”,且该情感词属于正面评价,则可在上述步骤103中,在第二子库中查找评价结果为正面评价,且含有“查话费”的APP。
因此,本发明实施例的应用程序搜索APP的方法,还可根据用户搜索信息中的情感词来搜索满足要求的APP,进一步满足了用户的多种搜索需求,提升了用户使用体验。
实施例三
依据本发明实施例的另一个方面,还提供了一种应用程序APP索引库的创建装置,如图3所示,该装置300包括:
第一获取模块301,用于获取与第一APP相关的基本信息和隐含信息,其中,所述基本信息包括所述第一APP的提供商提供的对所述第一APP的基本介绍信息,所述隐含信息包括用户对所述第一APP的评论信息;
建立模块309,用于分别建立所述基本信息、所述隐含信息与所述第一APP的索引关系,并保存在索引库中。
可选地,如图3所示,该装置300还包括:
第一提取模块303,用于从所述隐含信息中提取情感词;
确定模块305,用于依据所述情感词确定用户对所述第一APP的评价结果。
可选地,如图3所述,所述装置还包括:
第二提取模块307,用于从所述隐含信息中提取实体词。
可选地,所述实体词和所述情感词是依据对所述隐含信息进行分词处理后获得的词语和预先存储的实体词库和情感词库确定的。
可选地,如图4所示,所述确定模块305包括:
统计单元3051,用于统计所述情感词的总数量n,所述情感词中属于正面评价的情感词的数量x,以及所述情感词中属于负面评价的情感词的数量y,其中,n,x和y均为整数;
第一确定单元3052,用于当x/n超过预定阈值时,所述第一APP的评价结果为正面评价;
第二确定单元3053,用于当y/n超过预定阈值时,所述第一APP的评价结果为负面评价。
可选地,如图5所示,所述第一获取模块301包括:
基本信息获取单元3011,用于通过爬虫技术搜集与所述第一APP相关的基本信息;
隐含信息获取单元3012,用于通过爬虫技术抓取与所述第一APP相关的网页,并通过预定模板对所述网页上的内容进行解析,获取所述隐含信息。
可选地,所述索引库包括第一子库、第二子库和第三子库,如图6所示,所述建立模块309包括:
第一建立单元3091,用于建立所述基本信息与所述第一APP之间的索引关系,并保存在所述第一子库中;
第二建立单元3092,用于建立所述隐含信息与所述第一APP之间的索引关系,并保存在所述第二子库中;
第三建立单元3093,用于分别建立所述实体词和所述评价结果与所述第一APP之间的索引关系,并保存在所述第三子库中。
实施例四
依据本发明实施例的另一个方面,还提供了一种搜索应用程序APP的装置,如图7所示,该装置800包括:
第二获取模块801,用于获取用户输入的搜索信息;
第一搜索模块803,用于在预存的基本信息和与APP之间的索引关系,以及隐含信息与APP之间的索引关系中,查找与所述搜索信息相匹配的第一基本信息和第一隐含信息,并将所述第一基本信息和所述第一隐含信息对应的APP作为备选APP,其中,所述基本信息包括所述APP的提供商提供的对所述APP的基本介绍信息,所述隐含信息包括用户对所述APP的评论信息;
显示模块811,用于获取所述备选APP的基本信息,并显示给用户。
可选地,如图8所示,所述第一搜索模块803包括:
处理单元8031,用于对所述搜索信息进行分词处理,获得所述搜索信息包括的词语;
第一查找单元8032,用于依据所述搜索信息包括的词语,在预存的所述基本信息与APP之间的索引关系中,查找与所述搜索信息相匹配的第一基本信息;
第一记录单元8033,用于当查找到所述第一基本信息时,获取与所述第一基本信息相对应的APP,并作为第一备选APP保存;
第二查找单元8034,用于依据所述搜索信息包括的词语,在预存的所述隐含信息与APP之间的索引关系中,查找与所述搜索信息相匹配的第一隐含信息;
第二记录单元8035,用于当查找到所述第一隐含信息时,获取与所述第一隐含信息相对应的APP,并作为第二备选APP保存。
可选地,如图7所示,所述装置还包括:
第三提取模块805,用于从所述搜索信息中提取所述搜索信息的第一实体词;
第二搜索模块807,用于第二搜索模块,用于依据所述第一实体词,在预存的从所述隐含信息中提取的实体词与APP的索引关系中,查找与所述搜索信息相匹配的实体词,并当查找到时,获取与所述搜索信息相匹配的实体词相对应的APP,并作为第三备选APP保存。
可选地,如图7所示,所述装置还包括:
第三搜索模块809,用于从所述搜索信息中提取第一情感词,并当所述第一情感词属于正面评价时,在所述第三备选APP中,依据预存的评价结果与APP之间的索引关系,查找评价结果为正面评价的APP,并在查找到时,作为第四备选APP保存;
当所述第一情感词属于负面评价时,在所述第三备选APP中,依据预存的所述评价结果与APP之间的索引关系,查找评价结果为负面评价的APP,并在查找到时,作为第五备选APP保存,其中,所述评价结果是依据从所述隐含信息中提取的情感词确定的。
可选地,如图9所示,所述显示模块811包括:
第二获取单元8111,用于分别获取第一备选APP、第二备选APP、第三备选APP、第四备选APP以及第五备选APP的基本信息;
显示单元8112,用于按照第一备选APP、第三备选APP、第四备选APP、第五备选APP、第二备选APP的顺序,将所述基本信息显示给用户;或者,当所述第一备选APP、第二备选APP、第三备选APP、第四备选APP以及第五备选APP中存在相同的APP时,将相同APP的基本信息显示给用户。
以上所述的是本发明的优选实施方式,应当指出对于本技术领域的普通人员来说,在不脱离本发明所述的原理前提下还可以作出若干改进和润饰,这些改进和润饰也在本发明的保护范围内。
Claims (22)
1.一种应用程序APP索引库的创建方法,其特征在于,包括:
获取与第一APP相关的基本信息和隐含信息,其中,所述基本信息包括所述第一APP的提供商提供的对所述第一APP的基本介绍信息,所述隐含信息包括用户对所述第一APP的评论信息;
分别建立所述基本信息、所述隐含信息与所述第一APP的索引关系,并保存在索引库中。
2.如权利要求1所述的方法,其特征在于,所述获取与第一APP相关的基本信息和隐含信息的步骤之后,所述方法还包括:
从所述隐含信息中提取情感词;
依据所述情感词确定用户对所述第一APP的评价结果。
3.如权利要求2所述的方法,其特征在于,所述获取与第一APP相关的基本信息和隐含信息的步骤之后,所述方法还包括:
从所述隐含信息中提取实体词,所述实体词和所述情感词是依据对所述隐含信息进行分词处理后获得的词语和预先存储的实体词库和情感词库确定的。
4.如权利要求2所述的方法,其特征在于,所述依据所述情感词确定用户对所述第一APP的评价结果的步骤包括:
统计所述情感词的总数量n,所述情感词中属于正面评价的情感词的数量x,以及所述情感词中属于负面评价的情感词的数量y,其中,n,x和y均为整数;
当x/n超过预定阈值时,所述第一APP的评价结果为正面评价;
当y/n超过预定阈值时,所述第一APP的评价结果为负面评价。
5.如权利要求1所述的方法,其特征在于,所述获取与第一APP相关的基本信息和隐含信息的步骤包括:
通过爬虫技术搜集与所述第一APP相关的基本信息;
通过爬虫技术抓取与所述第一APP相关的网页,并通过预定模板对所述网页上的内容进行解析,获取所述隐含信息。
6.如权利要求3所述的方法,其特征在于,所述索引库包括第一子库、第二子库和第三子库,所述分别建立所述基本信息、所述隐含信息与所述第一APP的索引关系,并保存在索引库中的步骤包括:
建立所述基本信息与所述第一APP之间的索引关系,并保存在所述第一子库中;
建立所述隐含信息与所述第一APP之间的索引关系,并保存在所述第二子库中;
分别建立所述实体词和所述评价结果与所述第一APP之间的索引关系,并保存在所述第三子库中。
7.一种搜索应用程序APP的方法,其特征在于,包括:
获取用户输入的搜索信息;
在预存的基本信息和与APP之间的索引关系,以及隐含信息与APP之间的索引关系中,查找与所述搜索信息相匹配的第一基本信息和第一隐含信息,并将所述第一基本信息和所述第一隐含信息对应的APP作为备选APP,其中,所述基本信息包括所述APP的提供商提供的对所述APP的基本介绍信息,所述隐含信息包括用户对所述APP的评论信息;
获取所述备选APP的基本信息,并显示给用户。
8.如权利要求7所述的方法,其特征在于,所述在预存的基本信息与APP之间的索引关系,以及隐含信息与APP之间的索引关系中,查找与所述搜索信息相匹配的第一基本信息和第一隐含信息,并将所述第一基本信息和所述第一隐含信息相对应的APP作为备选APP的步骤包括:
对所述搜索信息进行分词处理,获得所述搜索信息包括的词语;
依据所述搜索信息包括的词语,在预存的所述基本信息与APP之间的索引关系中,查找与所述搜索信息相匹配的第一基本信息;
当查找到所述第一基本信息时,获取与所述第一基本信息相对应的APP,并作为第一备选APP保存;
依据所述搜索信息包括的词语,在预存的所述隐含信息与APP之间的索引关系中,查找与所述搜索信息相匹配的第一隐含信息;
当查找到所述第一隐含信息时,获取与所述第一隐含信息相对应的APP,并作为第二备选APP保存。
9.如权利要求8所述的方法,其特征在于,所述获取用户输入的搜索信息的步骤之后,所述方法还包括:
从所述搜索信息中提取所述搜索信息的第一实体词;
依据所述第一实体词,在预存的从所述隐含信息中提取的实体词与APP之间的索引关系中,查找与所述搜索信息相匹配的实体词,并当查找到时,获取与所述搜索信息相匹配的实体词相对应的APP,并作为第三备选APP保存。
10.如权利要求9所述的方法,其特征在于,所述当查找到时,获取与所述搜索信息相匹配的实体词相对应的APP之后,所述方法还包括:
从所述搜索信息中提取第一情感词,并当所述第一情感词属于正面评价时,在所述第三备选APP中,依据预存的评价结果与APP之间的索引关系,查找评价结果为正面评价的APP,并在查找到时,作为第四备选APP保存;
当所述第一情感词属于负面评价时,在所述第三备选APP中,依据预存的所述评价结果与APP之间的索引关系,查找评价结果为负面评价的APP,并在查找到时,作为第五备选APP保存,其中,所述评价结果是依据从所述隐含信息中提取的情感词确定的。
11.如权利要求10所述的方法,其特征在于,所述获取所述备选APP的基本信息,并显示给用户的步骤包括:
分别获取第一备选APP、第二备选APP、第三备选APP、第四备选APP以及第五备选APP的基本信息;
按照第一备选APP、第三备选APP、第四备选APP、第五备选APP、第二备选APP的顺序,将所述基本信息显示给用户;或者
当所述第一备选APP、第二备选APP、第三备选APP、第四备选APP以及第五备选APP中存在相同的APP时,将相同APP的基本信息显示给用户。
12.一种应用程序APP索引库的创建装置,其特征在于,包括:
第一获取模块,用于获取与第一APP相关的基本信息和隐含信息,其中,所述基本信息包括所述第一APP的提供商提供的对所述第一APP的基本介绍信息,所述隐含信息包括用户对所述第一APP的评论信息;
建立模块,用于分别建立所述基本信息、所述隐含信息与所述第一APP的索引关系,并保存在索引库中。
13.如权利要求12所述的装置,其特征在于,所述装置还包括:
第一提取模块,用于从所述隐含信息中提情感词;
确定模块,用于依据所述情感词确定用户对所述第一APP的评价结果。
14.如权利要求13所述的装置,其特征在于,所述装置还包括:
第二提取模块,用于从所述隐含信息中提取实体词,所述实体词和所述情感词是依据对所述隐含信息进行分词处理后获得的词语和预先存储的实体词库和情感词库确定的。
15.如权利要求13所述的装置,其特征在于,所述确定模块包括:
统计单元,用于统计所述情感词的总数量n,所述情感词中属于正面评价的情感词的数量x,以及所述情感词中属于负面评价的情感词的数量y,其中,n,x和y均为整数;
第一确定单元,用于当x/n超过预定阈值时,所述第一APP的评价结果为正面评价;
第二确定单元,用于当y/n超过预定阈值时,所述第一APP的评价结果为负面评价。
16.如权利要求12所述的装置,其特征在于,所述第一获取模块包括:
基本信息获取单元,用于通过爬虫技术搜集与所述第一APP相关的基本信息;
隐含信息获取单元,用于通过爬虫技术抓取与所述第一APP相关的网页,并通过预定模板对所述网页上的内容进行解析,获取所述隐含信息。
17.如权利要求14所述的装置,其特征在于,所述索引库包括第一子库、第二子库和第三子库,所述建立模块包括:
第一建立单元,用于建立所述基本信息与所述第一APP之间的索引关系,并保存在所述第一子库中;
第二建立单元,用于建立所述隐含信息与所述第一APP之间的索引关系,并保存在所述第二子库中;
第三建立单元,用于分别建立所述实体词和所述评价结果与所述第一APP之间的索引关系,并保存在所述第三子库中。
18.一种搜索应用程序APP的装置,其特征在于,包括:
第二获取模块,用于获取用户输入的搜索信息;
第一搜索模块,用于在预存的基本信息和与APP之间的索引关系,以及隐含信息与APP之间的索引关系中,查找与所述搜索信息相匹配的第一基本信息和第一隐含信息,并将所述第一基本信息和所述第一隐含信息对应的APP作为备选APP,其中,所述基本信息包括所述APP的提供商提供的对所述APP的基本介绍信息,所述隐含信息包括用户对所述APP的评论信息;
显示模块,用于获取所述备选APP的基本信息,并显示给用户。
19.如权利要求18所述的装置,其特征在于,所述第一搜索模块包括:
处理单元,用于对所述搜索信息进行分词处理,获得所述搜索信息包括的词语;
第一查找单元,用于依据所述搜索信息包括的词语,在预存的所述基本信息与APP之间的索引关系中,查找与所述搜索信息相匹配的第一基本信息;
第一记录单元,用于当查找到所述第一基本信息时,获取与所述第一基本信息相对应的APP,并作为第一备选APP保存;
第二查找单元,用于依据所述搜索信息包括的词语,在预存的所述隐含信息与APP之间的索引关系中,查找与所述搜索信息相匹配的第一隐含信息;
第二记录单元,用于当查找到所述第一隐含信息时,获取与所述第一隐含信息相对应的APP,并作为第二备选APP保存。
20.如权利要求19所述的装置,其特征在于,所述装置还包括:
第三提取模块,用于从所述搜索信息中提取所述搜索信息的第一实体词;
第二搜索模块,用于依据所述第一实体词,在预存的从所述隐含信息中提取的实体词与APP之间的索引关系中,查找与所述搜索信息相匹配的实体词,并当查找到时,获取与所述搜索信息相匹配的实体词相对应的APP,并作为第三备选APP保存。
21.如权利要求20所述的装置,其特征在于,所述装置还包括:
第三搜索模块,用于从所述搜索信息中提取第一情感词,并当所述第一情感词属于正面评价时,在所述第三备选APP中,依据预存的评价结果与APP之间的索引关系,查找评价结果为正面评价的APP,并在查找到时,作为第四备选APP保存;当所述第一情感词属于负面评价时,在所述第三备选APP中,依据预存的所述评价结果与APP之间的索引关系,查找评价结果为负面评价的APP,并在查找到时,作为第五备选APP保存,其中,所述评价结果是依据从所述隐含信息中提取的情感词确定的。
22.如权利要求21所述的装置,其特征在于,所述显示模块包括:
第二获取单元,用于分别获取第一备选APP、第二备选APP、第三备选APP、第四备选APP以及第五备选APP的基本信息;
显示单元,用于按照第一备选APP、第三备选APP、第四备选APP、第五备选APP、第二备选APP的顺序,将所述基本信息显示给用户;或者,当所述第一备选APP、第二备选APP、第三备选APP、第四备选APP以及第五备选APP中存在相同的APP时,将相同APP的基本信息显示给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510590959.XA CN106547748A (zh) | 2015-09-16 | 2015-09-16 | 一种app索引库的创建方法及装置、搜索app的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510590959.XA CN106547748A (zh) | 2015-09-16 | 2015-09-16 | 一种app索引库的创建方法及装置、搜索app的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106547748A true CN106547748A (zh) | 2017-03-29 |
Family
ID=58361748
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510590959.XA Pending CN106547748A (zh) | 2015-09-16 | 2015-09-16 | 一种app索引库的创建方法及装置、搜索app的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106547748A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107861753A (zh) * | 2017-06-26 | 2018-03-30 | 平安普惠企业管理有限公司 | App生成索引、检索方法和系统及可读存储介质 |
CN107871008A (zh) * | 2017-11-17 | 2018-04-03 | 中国科学院计算技术研究所 | 一种生成用于用户代理信息的数据库的方法 |
CN109145186A (zh) * | 2018-07-09 | 2019-01-04 | 湖北中医药大学 | 一种移动应用数据处理方法 |
WO2021042234A1 (zh) * | 2019-09-02 | 2021-03-11 | 深圳海付移通科技有限公司 | 应用程序的介绍方法、移动终端及服务器 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103679462A (zh) * | 2012-08-31 | 2014-03-26 | 阿里巴巴集团控股有限公司 | 一种评论数据处理方法和装置、一种搜索方法和系统 |
CN103823893A (zh) * | 2014-03-11 | 2014-05-28 | 北京大学 | 一种基于用户评论的产品检索方法及产品检索系统 |
US20140188897A1 (en) * | 2013-01-02 | 2014-07-03 | CrowdChunk LLC | CrowdChunk System, Method and Computer Program Product for Searching Summaries of Mobile Apps Reviews |
CN104462333A (zh) * | 2014-12-03 | 2015-03-25 | 上海耀肖电子商务有限公司 | 购物搜索推荐与告警方法和系统 |
-
2015
- 2015-09-16 CN CN201510590959.XA patent/CN106547748A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103679462A (zh) * | 2012-08-31 | 2014-03-26 | 阿里巴巴集团控股有限公司 | 一种评论数据处理方法和装置、一种搜索方法和系统 |
US20140188897A1 (en) * | 2013-01-02 | 2014-07-03 | CrowdChunk LLC | CrowdChunk System, Method and Computer Program Product for Searching Summaries of Mobile Apps Reviews |
CN103823893A (zh) * | 2014-03-11 | 2014-05-28 | 北京大学 | 一种基于用户评论的产品检索方法及产品检索系统 |
CN104462333A (zh) * | 2014-12-03 | 2015-03-25 | 上海耀肖电子商务有限公司 | 购物搜索推荐与告警方法和系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107861753A (zh) * | 2017-06-26 | 2018-03-30 | 平安普惠企业管理有限公司 | App生成索引、检索方法和系统及可读存储介质 |
CN107871008A (zh) * | 2017-11-17 | 2018-04-03 | 中国科学院计算技术研究所 | 一种生成用于用户代理信息的数据库的方法 |
CN109145186A (zh) * | 2018-07-09 | 2019-01-04 | 湖北中医药大学 | 一种移动应用数据处理方法 |
WO2021042234A1 (zh) * | 2019-09-02 | 2021-03-11 | 深圳海付移通科技有限公司 | 应用程序的介绍方法、移动终端及服务器 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2544771C2 (ru) | Выведение специфичной для пользователя семантики местоположения из пользовательских данных | |
CN102402619B (zh) | 一种搜索方法和装置 | |
CN109614482B (zh) | 标签的处理方法、装置、电子设备及存储介质 | |
CN109815952A (zh) | 品牌名称识别方法、计算机装置及计算机可读存储介质 | |
CN104077415B (zh) | 搜索方法及装置 | |
CN103870538B (zh) | 针对用户进行个性化推荐的方法、用户建模设备及系统 | |
CN106547748A (zh) | 一种app索引库的创建方法及装置、搜索app的方法及装置 | |
CN106407361A (zh) | 基于人工智能的推送信息的方法和装置 | |
CN111259271A (zh) | 评论信息的展示方法、装置、电子设备及计算机可读介质 | |
CN103631794A (zh) | 一种用于对搜索结果进行排序的方法、装置与设备 | |
CN103425662B (zh) | 一种网络社区中的信息搜索方法和装置 | |
CN101299217A (zh) | 一种地图信息处理的方法、装置和系统 | |
CN103136213B (zh) | 一种提供相关词的方法及装置 | |
CN104503988B (zh) | 搜索方法及装置 | |
CN105824961B (zh) | 一种标签确定方法及装置 | |
CN105975479A (zh) | 一种基于标签库的电信用户兴趣度分析方法及系统 | |
CN108197243A (zh) | 一种基于用户身份的输入联想推荐方法及装置 | |
CN106919571A (zh) | 获取与搜索关键词相匹配的图片的方法及装置 | |
CN105607757A (zh) | 一种输入方法和装置、一种用于输入的装置 | |
CN108647312A (zh) | 一种用户偏好分析方法及其装置 | |
CN108537291A (zh) | 一种样本分类方法和装置 | |
CN103744887A (zh) | 一种用于人物搜索的方法、装置和计算机设备 | |
CN103744954A (zh) | 一种词关联网模型的构建方法及其构建器 | |
CN103412880A (zh) | 一种用于确定多媒体资源间隐式关联信息的方法与设备 | |
CN110019913A (zh) | 图片匹配方法、用户设备、存储介质及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170329 |