CN106919576A - 利用二级类目下的关键词库搜索应用程序的方法及装置 - Google Patents

利用二级类目下的关键词库搜索应用程序的方法及装置 Download PDF

Info

Publication number
CN106919576A
CN106919576A CN201510990108.4A CN201510990108A CN106919576A CN 106919576 A CN106919576 A CN 106919576A CN 201510990108 A CN201510990108 A CN 201510990108A CN 106919576 A CN106919576 A CN 106919576A
Authority
CN
China
Prior art keywords
grades
application program
search
now
classes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510990108.4A
Other languages
English (en)
Inventor
王振凯
曹国栋
唐竞胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201510990108.4A priority Critical patent/CN106919576A/zh
Publication of CN106919576A publication Critical patent/CN106919576A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种利用二级类目下的关键词库搜索应用程序的方法及装置,利用一级类目下的各应用程序的描述信息,采用分类器将各应用程序分为相应一级类目下的二级类目;根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算搜索词所对应的二级类目;根据各搜索词所对应的二级类目,生成二级类目下的关键词库;当接收到用户输入的搜索关键词时,若所述搜索关键词与各二级类目下的关键词库匹配成功,获取与所述搜索关键词对应的二级类目下的应用程序。本发明公开的利用应用程序的关键词库搜索应用程序的方法及装置,解决了应用程序开发商需要通过繁琐的操作选择应用程序的索引关键词的问题,由于选择的索引关键词不恰当,导致应用程序出现在与用户输入的搜索词相关度很低的搜索结果中的概率较高的问题。

Description

利用二级类目下的关键词库搜索应用程序的方法及装置
技术领域
本发明涉及搜索技术领域,具体涉及一种利用二级类目下的关键词库搜索应用程序的方法及装置。
背景技术
随着智能移动终端的发展,越来越多的用户在智能移动终端中下载各种APP(application,应用程序)使用。基于该种情况,应用程序分发平台应运而生,用户可以通过智能移动终端访问应用程序分发平台,比如通过智能移动终端中安装的应用程序分发应用去访问应用程序分发平台,从而可以从平台中下载各种应用程序。其中,应用程序分发应用比如各种手机助手。
而在应用程序分发平台中,为了能够为有推广需求的应用程序拥有者,如应用程序开发商,可以将该应用程序拥有者的应用程序在应用程序搜索页面可以靠前展示,应用程序拥有者会为这些应用程序购买竞价词以作为索引关键词。
但是,应用程序开发商购买的竞价词可能与应用程序本身不匹配,使应用分发平台的搜索引擎在根据用户输入的搜索词进行检索时,可能返回实际上与该搜索词相关度很低的应用程序的信息,导致用户为了查找与其需求的应用程序时,需要进行更多的操作,比如翻页等操作,影响获取其需求的应用程序的效率。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的利用二级类目下的关键词库搜索应用程序的方法及装置。
一方面,本申请通过本申请的一实施例提供了一种利用二级类目下的关键词库搜索应用程序的方法,所述方法包括:
对于各一级类目下的应用程序,利用一级类目下的各应用程序的描述信息,采用分类器将各应用程序分为相应一级类目下的二级类目;
对每个搜索词,根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算搜索词所对应的二级类目;
针对各二级类目,根据各搜索词所对应的二级类目,生成二级类目下的关键词库;
当接收到用户输入的搜索关键词时,将所述搜索关键词与各二级类目下的关键词库进行匹配;
若匹配成功,获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序。
可选的,所述对每个搜索词,根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算所述搜索词所对应的二级类目,具体包括:
对于各搜索词中的搜索历史记录中的搜索下载记录,判断所述搜索词的独立访问下载次数是否大于预设阈值;
如果所述搜索词的独立访问下载次数大于所述预设阈值,则根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算所述搜索词所对应的二级类目。
可选的,所述将所述搜索关键词与各二级类目下的关键词库进行匹配,具体包括:
检测各二级类目下的关键词库中是否存在与所述搜索关键词相匹配的关键词。
可选的,所述若匹配成功,获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序,具体包括:
若检测到某二级类目下的关键词库中存在与所述搜索关键词相匹配的关键词,则获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序。
可选的,所述采用分类器将各应用程序分为相应一级类目下的二级类目之后,所述方法还包括:
根据各应用程序对应的二级类目,获取各二级类目下的应用程序集合库。
可选的,所述获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序,具体包括:
根据与所述搜索关键词对应的二级类目,获取该二级类目下的应用程序集合库;
将该二级类目下的应用程序集合库中的所有应用程序作为与所述搜索关键词对应的应用程序。
可选的,还包括:
若匹配失败,计算所述搜索关键词和各应用程序的名称之间的文本相似度;
将所述文本相似度大于预设相似度的应用程序作为所述搜索关键词对应的应用程序。
另一方面,本申请通过本申请的一实施例,提供了一种利用二级类目下的关键词库搜索应用程序的装置,所述装置包括:
应用程序分类单元,对于各一级类目下的应用程序,用于利用一级类目下的各应用程序的描述信息,采用分类器将各应用程序分为相应一级类目下的二级类目;
搜索词分类单元,对每个搜索词,用于根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算搜索词所对应的二级类目;
二级类目关键词库生成单元,针对各二级类目,用于根据各搜索词所对应的二级类目,生成二级类目下的关键词库;
匹配单元,用于当接收到用户输入的搜索关键词时,将所述搜索关键词与各二级类目下的关键词库进行匹配;
应用程序获取单元,用于在检测到匹配成功时,获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序。
可选的,所述搜索词分类单元,具体包括:
独立访问下载次数判断单元,对于各搜索词中的搜索历史记录中的搜索下载记录,用于判断所述搜索词的独立访问下载次数是否大于预设阈值;如果所述搜索词的独立访问下载次数大于所述预设阈值,则根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算所述搜索词所对应的二级类目。
可选的,所述匹配单元,具体用于检测各二级类目下的关键词库中是否存在与所述搜索关键词相匹配的关键词。
可选的,所述匹配单元,用于在检测到某二级类目下的关键词库中存在与所述搜索关键词相匹配的关键词时,获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序。
可选的,所述装置,还包括:
应用程序集合库生成单元,用于在采用分类器将各应用程序分为相应一级类目下的二级类目之后,根据各应用程序对应的二级类目,获取各二级类目下的应用程序集合库。
可选的,所述应用程序获取单元,具体用于根据与所述搜索关键词对应的二级类目,获取该二级类目下的应用程序集合库,将该二级类目下的应用程序集合库中的所有应用程序作为与所述搜索关键词对应的应用程序。
可选的,所述装置还包括:
文本相似度获取单元,用于在匹配失败时,计算所述搜索关键词和各应用程序的名称之间的文本相似度;
所述应用程序获取单元,还用于将所述文本相似度大于预设相似度的应用程序作为所述搜索关键词对应的应用程序。
本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
根据本发明的利用二级类目下的关键词库搜索应用程序的方法及装置,将各应用程序进行二级类目划分,以及根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算搜索词所对应的二级类目,从而生成每一个二级类目下的关键词库,然后将所述搜索关键词与各二级类目下的关键词库进行匹配;若匹配成功,获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序,如此,通过将应用程序和搜索词进行类目细分,
使得二级类目下的关键词库中的关键词与应用程序的相关性得以提高,由此解决了应用程序开发商需要通过繁琐的操作选择应用程序的索引关键词的问题,以及由于选择的索引关键词不恰当,导致应用程序出现在与用户输入的搜索词相关度很低的搜索结果中的概率较高的问题,取得了可以通过应用程序的关键词库自动为应用程序自动选择索引关键词,减少应用程序开发商对应用程序索引关键词的选择过程,有效提高应用程序出现在与用户输入的搜索词相关度较高的搜索结果中的概率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中的利用二级类目下的关键词库搜索应用程序的方法的流程图;
图2为本发明实施例中的利用二级类目下的关键词库搜索应用程序的装置的结构图。
具体实施方式
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的利用二级类目下的关键词库搜索应用程序的方法及装置。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
首先说明,本文中出现的术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
参见图1,本申请一实施例提供了一种利用二级类目下的关键词库搜索应用程序的方法,所述方法包括以下步骤:
S101、对于各一级类目下的应用程序,利用一级类目下的各应用程序的描述信息,采用分类器将各应用程序分为相应一级类目下的二级类目;
S102、对每个搜索词,根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算搜索词所对应的二级类目;
S103、针对各二级类目,根据各搜索词所对应的二级类目,生成二级类目下的关键词库;
S104、当接收到用户输入的搜索关键词时,将所述搜索关键词与各二级类目下的关键词库进行匹配;
S105、若匹配成功,获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序。
在本发明实施例中,应用程序的拥有者等可在应用分发平台中上传应用程序,然后向应用分发平台发送推广该应用程序的请求。
在步骤S101中,在应用分发平台中预设的各种分类,该分类从一级分类开始,比如游戏类、体育类。而实际上,对于一个一级类目下的应用程序,可以根据其应用程序的描述信息进行更细的分类。在实际应用中,可以利用贝叶斯分类器对描述信息进行分类,将一级类目下的各应用程序分到各二级类目下。
在具体实施过程中,应用程序的描述信息包括应用程序的应用场景、支持的系统、开发者信息等,如此,可以利用贝叶斯分类器对应用程序的描述信息进行分类,将一级类目下的各应用程序分到各二级类目下。
例如,以一级类目为游戏类为例,若游戏类下的应用程序包括a1、a2、a3、b1、b2、b3、c1、c2和c3,用贝叶斯分类器对游戏类下的每一个应用程序的描述信息进行分类,从而游戏类目下的二级类目为手游类、端游类和页游类,且手游类下的应用程序为a1、a2和a3;端游类下的应用程序为b1、b2和b3;页游类下的应用程序为页游类c1、c2和c3。
接下来执行步骤S102,在该步骤中,对每个搜索词,根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算搜索词所对应的二级类目。
在具体实施过程中,在用户终端启用应用程序分发应用访问应用分发平台。比如用户在其手机中启动360手机助手,360手机助手则连接到应用分发平台。用户可以在应用程序分发应用的搜索框中输入搜索词,该搜索词上传到应用分发平台,应用分发平台根据该搜索词检索应用程序搜索结果并返回应用程序分发应用中,应用程序分发应用则展示按序展示该应用程序搜索结果,用户可以在搜索结果中点击查看或者点击下载应用程序。那么在大量用户的搜索过程中,应用分发平台可以对各个搜索词的搜索历史进行记录,得到各个搜索词搜索历史记录,例如应用分发平台可以通过日志记录上述搜索历史记录。
具体来讲,根据从应用分发平台中存储的搜索历史记录中搜索词与各应用程序的点击关系,以及通过步骤S101获取的各应用程序所属的二级类目,从而可以计算出搜索词所对应的二级类目。
具体的,在计算搜索词所对应的二级类目时,针对每一个搜索词,首先可以从搜索历史记录中的获取到与该搜索词具有点击关系的N个应用程序,然后根据所述N个应用程序中每一个应用程序所属的二级类目,查找到属于同一二级类目下应用程序数量最多的二级类目作为该搜索词所对应的二级类目,其中,N为不小于2的整数;当然,也可以根据搜索词与各应用程序的点击关系,选择与该搜索词的点击次数最多的应用程序所属的二级类目作为该搜索词的二级类目。
例如,搜索历史记录中搜索词d1与各应用程序的点击关系如下:d1对应a1的点击次数为5000次、对应a2的点击次数为1000次、对应a3的点击次数为200次、对应b1的点击次数为100次和对应c2的点击次数为50次,由于a1、a2和a3所属的二级类目均为手游类,使得手游类下的应用程序数量最多,由此,可以确定d1所属的二级类目为手游类。
又例如,搜索词1点击二级类目1中的应用程序的次数的占比大于占比阈值,则将该搜索词归到该二级类目1下。
上述搜索词与各应用程序的点击关系,可以为搜索词与各应用程序的点击查看之间的关系,也可以为搜索词与各应用程序的点击下载之间的关系,当然也可以为搜索词与各应用程序的点击查看和点击下载之间的总的关系。
在另一实施例中,在计算所述搜索词所对应的二级类目时,还可以通过以下步骤来计算:
A1、对于各搜索词中的搜索历史记录中的搜索下载记录,判断所述搜索词的独立访问下载次数是否大于预设阈值。
A2、如果所述搜索词的独立访问下载次数大于所述预设阈值,则根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算所述搜索词所对应的二级类目。
在实际应用中,用户在终端中输入了搜索词进行搜索,其可能点击下载应用程序也可能不下载应用程序,那么应用分发平台则可以记录各个搜索词的搜索下载情况,比如用户A搜索“理财”,在搜索结果页中下载了应用程序1,而用户B搜索“理财”,则可能在搜索结果页中下载了应用程序2,通过对大量用户的搜索下载行为的记录,则可得到对各搜索词的搜索下载记录。
具体实现中,该搜索下载记录以搜索下载日志的形式存储在应用分发平台中。
对于搜索下载日志中一个搜索词,可能有多个用户在终端展示的该搜索词的搜索结果中下载应用程序,而其存在同一个IP的终端下载了多个应用程序或者同一个应用程序下载了多次。而为了减少同一个IP的终端对搜索词下载权重的影响,本发明实施例则统计每个搜索词的独立访问下载次数,即UV(Unique Visitor)下载,即即使同一个IP的终端的下载了多次,其UV下载次数也只算一次。然后对于一个搜索词,统计有多少个IP的终端使用该搜索词的搜索结果下载了应用程序。
然后,本发明实施例设置了针对UV下载次数的预设阈值,如果判断搜索词的UV下载次数大于该预设阈值,则根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算所述搜索词所对应的二级类目。而对于一个搜索词,其独立访问下载次数小于等于预设阈值,则可以忽略该搜索词。
接下来执行步骤S103,在该步骤中,针对各二级类目,根据各搜索词所对应的二级类目,生成二级类目下的关键词库。
在具体实施过程中,在通过步骤S102获取到了各搜索词所对应的二级类目之后,针对各二级类目,获取该二级类目下的所有搜索词,并根据该二级类目下的所有搜索词来生成该二级类目下的关键词库。
例如,手游类下的所有搜索词为d1、d2、d3、d4和d5,则生成手游类下的关键词库,其中,手游类下的关键词库包括d1、d2、d3、d4和d5。
接下来执行步骤S104,在该步骤中,当接收到用户输入的搜索关键词时,将所述搜索关键词与各二级类目下的关键词库进行匹配。
在具体实施过程中,在步骤S103生成各二级类目下的关键词库之后,当接收到用户在终端中输入的搜索关键词时,通过该搜索关键词查找对应的应用程序的时,将该搜索关键词与各二级类目下的关键词库进行匹配。
具体的,在将该搜索关键词与各二级类目下的关键词库进行匹配时,可以是检测各二级类目下的关键词库中是否存在与所述搜索关键词相匹配的关键词,如存在,则确定匹配成功,执行步骤S105;若不存在,则确定匹配失败,执行步骤S106。
若匹配成功,执行步骤S105,获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序。
在具体实施过程中,若通过步骤S104检测某二级类目下的关键词库中存在与所述搜索关键词相匹配的关键词,则获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序。
具体来讲,可以将与所述搜索关键词对应的二级类目下的所有应用程序作为与所述搜索关键词对应的应用程序,当然也可以是将与所述搜索关键词对应的二级类目下的部分应用程序作为与所述搜索关键词对应的应用程序,本申请不作具体限制。
在另一实施例中,所述采用分类器将各应用程序分为相应一级类目下的二级类目之后,所述方法还包括:根据各应用程序对应的二级类目,获取各二级类目下的应用程序集合库。
在具体实施过程中,在通过步骤S101获取到了各应用程序所对应的二级类目之后,针对各二级类目,获取该二级类目下的所有应用程序,并根据该二级类目下的所有应用程序来生成该二级类目下的应用程序集合库。
例如,手游类下的所有应用程序为a1、a2、a3、a4和a5,则生成手游类下的应用程序集合库,其中,手游类下的应用程序集合库包括a1、a2、a3、a4和a5。
具体的,在获取与所述搜索关键词对应的应用程序时,还可以根据与所述搜索关键词对应的二级类目,获取该二级类目下的应用程序集合库;将该二级类目下的应用程序集合库中的所有应用程序作为与所述搜索关键词对应的应用程序。
例如,若所述搜索关键词为d1,检测各二级类目下的关键词库中是否存在与所述搜索关键词相匹配的关键词,由于手游类下的关键词库中存在d1,从而可以确定匹配成功,且d1对应的二级类目为手游类,然后获取手游类下的应用程序集合库中的所有应用程序作为d1对应的应用程序,则确定d1对应的应用程序为a1、a2、a3、a4和a5。
若匹配失败,执行步骤S106,计算所述搜索关键词和各应用程序的名称之间的文本相似度;将所述文本相似度大于预设相似度的应用程序作为所述搜索关键词对应的应用程序。
本发明实施例在获取到所述搜索关键词之后,计算所述搜索关键词与应用程序的名称之间的文本相似度。如计算所述搜索关键词文本和应用程序名称文本之间的余弦距离。
本发明实施例可以针对文本相似度设置预设相似度,如果所述文本相似度大于预设相似度,则将该应用程序作为该搜索关键词对应的应用程序。如果所述文本相似度小于预设相似度,则忽略该应用程序。
在本发明实施例中,在一个应用程序需要推广时,在应用分发平台中会通过广告标识将其标记为推广应用程序,那么再检索到应用程序时,如果该应用程序有广告标识,则可以将其提前展示。该广告标识如“推广”、“荐”。此外,本发明实施例中可以设置多种广告标识,不同的广告标识具备不同的展示权重。比如“推广”的展示权重高,“荐”展示权重低于“推广”的展示权重。
其中,标识“推广”和“荐”字样的为推广应用程序,那么爱前进理财和有利网理财为推广应用程序。搜索“理财”关键字展现上述应用程序。
综上所述,本发明实施例将各应用程序进行二级类目划分,以及根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算搜索词所对应的二级类目,从而生成每一个二级类目下的关键词库,然后将所述搜索关键词与各二级类目下的关键词库进行匹配;若匹配成功,获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序,如此,通过将应用程序和搜索词进行类目细分,使得二级类目下的关键词库中的关键词与应用程序的相关性得以提高,由此解决了应用程序开发商需要通过繁琐的操作选择应用程序的索引关键词的问题,以及由于选择的索引关键词不恰当,导致应用程序出现在与用户输入的搜索词相关度很低的搜索结果中的概率较高的问题,取得了可以通过应用程序的关键词库自动为应用程序自动选择索引关键词,减少应用程序开发商对应用程序索引关键词的选择过程,有效提高应用程序出现在与用户输入的搜索词相关度较高的搜索结果中的概率。
基于同一发明构思,本申请另一实施例提供一种利用应用程序的关键词库搜索应用程序的装置,参见图2,所述装置包括:
应用程序分类单元201,对于各一级类目下的应用程序,用于利用一级类目下的各应用程序的描述信息,采用分类器将各应用程序分为相应一级类目下的二级类目;
搜索词分类单元202,对每个搜索词,用于根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算搜索词所对应的二级类目;
二级类目关键词库生成单元203,针对各二级类目,用于根据各搜索词所对应的二级类目,生成二级类目下的关键词库;
匹配单元204,用于当接收到用户输入的搜索关键词时,将所述搜索关键词与各二级类目下的关键词库进行匹配;
应用程序获取单元205,用于在检测到匹配成功时,获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序。
具体的,搜索词分类单元202,具体包括:
独立访问下载次数判断单元,对于各搜索词中的搜索历史记录中的搜索下载记录,用于判断所述搜索词的独立访问下载次数是否大于预设阈值;如果所述搜索词的独立访问下载次数大于所述预设阈值,则根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算所述搜索词所对应的二级类目。
具体的,匹配单元204,具体用于检测各二级类目下的关键词库中是否存在与所述搜索关键词相匹配的关键词。
具体的,匹配单元204,用于在检测到某二级类目下的关键词库中存在与所述搜索关键词相匹配的关键词时,获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序。
具体的,所述装置还包括:应用程序集合库生成单元,用于在采用分类器将各应用程序分为相应一级类目下的二级类目之后,根据各应用程序对应的二级类目,获取各二级类目下的应用程序集合库。
具体的,应用程序获取单元205,具体用于根据与所述搜索关键词对应的二级类目,获取该二级类目下的应用程序集合库,将该二级类目下的应用程序集合库中的所有应用程序作为与所述搜索关键词对应的应用程序。
具体的,所述装置还包括:
文本相似度获取单元,用于在匹配失败时,计算所述搜索关键词和各应用程序的名称之间的文本相似度;
应用程序获取单元205,还用于将所述文本相似度大于预设相似度的应用程序作为所述搜索关键词对应的应用程序。
上述本申请实施例中的技术方案,至少具有如下的技术效果或优点:
本申请公开的利用二级类目下的关键词库搜索应用程序的方法及装置,将各应用程序进行二级类目划分,以及根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算搜索词所对应的二级类目,从而生成每一个二级类目下的关键词库,然后将所述搜索关键词与各二级类目下的关键词库进行匹配;若匹配成功,获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序,如此,通过将应用程序和搜索词进行类目细分,
使得二级类目下的关键词库中的关键词与应用程序的相关性得以提高,由此解决了应用程序开发商需要通过繁琐的操作选择应用程序的索引关键词的问题,以及由于选择的索引关键词不恰当,导致应用程序出现在与用户输入的搜索词相关度很低的搜索结果中的概率较高的问题,取得了可以通过应用程序的关键词库自动为应用程序自动选择索引关键词,减少应用程序开发商对应用程序索引关键词的选择过程,有效提高应用程序出现在与用户输入的搜索词相关度较高的搜索结果中的概率。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
本发明公开A1、一种利用二级类目下的关键词库搜索应用程序的方法,其特征在于,所述方法包括:
对于各一级类目下的应用程序,利用一级类目下的各应用程序的描述信息,采用分类器将各应用程序分为相应一级类目下的二级类目;
对每个搜索词,根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算搜索词所对应的二级类目;
针对各二级类目,根据各搜索词所对应的二级类目,生成二级类目下的关键词库;
当接收到用户输入的搜索关键词时,将所述搜索关键词与各二级类目下的关键词库进行匹配;
若匹配成功,获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序。
A2、如A1所述的方法,其特征在于,所述对每个搜索词,根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算所述搜索词所对应的二级类目,具体包括:
对于各搜索词中的搜索历史记录中的搜索下载记录,判断所述搜索词的独立访问下载次数是否大于预设阈值;
如果所述搜索词的独立访问下载次数大于所述预设阈值,则根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算所述搜索词所对应的二级类目。
A3、如A2所述的方法,其特征在于,所述将所述搜索关键词与各二级类目下的关键词库进行匹配,具体包括:
检测各二级类目下的关键词库中是否存在与所述搜索关键词相匹配的关键词。
A4、如A2所述的方法,其特征在于,所述若匹配成功,获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序,具体包括:
若检测到某二级类目下的关键词库中存在与所述搜索关键词相匹配的关键词,则获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序。
A5、如A2所述的方法,其特征在于,所述采用分类器将各应用程序分为相应一级类目下的二级类目之后,所述方法还包括:
根据各应用程序对应的二级类目,获取各二级类目下的应用程序集合库。
A6、如A5所述的方法,其特征在于,所述获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序,具体包括:
根据与所述搜索关键词对应的二级类目,获取该二级类目下的应用程序集合库;
将该二级类目下的应用程序集合库中的所有应用程序作为与所述搜索关键词对应的应用程序。
A7、如A1所述的方法,其特征在于,还包括:
若匹配失败,计算所述搜索关键词和各应用程序的名称之间的文本相似度;
将所述文本相似度大于预设相似度的应用程序作为所述搜索关键词对应的应用程序。
B8、一种利用二级类目下的关键词库搜索应用程序的装置,其特征在于,所述装置包括:
应用程序分类单元,对于各一级类目下的应用程序,用于利用一级类目下的各应用程序的描述信息,采用分类器将各应用程序分为相应一级类目下的二级类目;
搜索词分类单元,对每个搜索词,用于根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算搜索词所对应的二级类目;
二级类目关键词库生成单元,针对各二级类目,用于根据各搜索词所对应的二级类目,生成二级类目下的关键词库;
匹配单元,用于当接收到用户输入的搜索关键词时,将所述搜索关键词与各二级类目下的关键词库进行匹配;
应用程序获取单元,用于在检测到匹配成功时,获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序。
B9、如B8所述的装置,其特征在于,所述搜索词分类单元,具体包括:
独立访问下载次数判断单元,对于各搜索词中的搜索历史记录中的搜索下载记录,用于判断所述搜索词的独立访问下载次数是否大于预设阈值;如果所述搜索词的独立访问下载次数大于所述预设阈值,则根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算所述搜索词所对应的二级类目。
B10、如B9所述的装置,其特征在于,所述匹配单元,具体用于检测各二级类目下的关键词库中是否存在与所述搜索关键词相匹配的关键词。
B11、如B9所述的装置,其特征在于,所述匹配单元,用于在检测到某二级类目下的关键词库中存在与所述搜索关键词相匹配的关键词时,获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序。
B12、如B9所述的装置,其特征在于,所述装置,还包括:
应用程序集合库生成单元,用于在采用分类器将各应用程序分为相应一级类目下的二级类目之后,根据各应用程序对应的二级类目,获取各二级类目下的应用程序集合库。
B13、如B12所述的装置,其特征在于,所述应用程序获取单元,具体用于根据与所述搜索关键词对应的二级类目,获取该二级类目下的应用程序集合库,将该二级类目下的应用程序集合库中的所有应用程序作为与所述搜索关键词对应的应用程序。
B14、如B8所述的装置,其特征在于,所述装置还包括:
文本相似度获取单元,用于在匹配失败时,计算所述搜索关键词和各应用程序的名称之间的文本相似度;
所述应用程序获取单元,还用于将所述文本相似度大于预设相似度的应用程序作为所述搜索关键词对应的应用程序。

Claims (10)

1.一种利用二级类目下的关键词库搜索应用程序的方法,其特征在于,所述方法包括:
对于各一级类目下的应用程序,利用一级类目下的各应用程序的描述信息,采用分类器将各应用程序分为相应一级类目下的二级类目;
对每个搜索词,根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算搜索词所对应的二级类目;
针对各二级类目,根据各搜索词所对应的二级类目,生成二级类目下的关键词库;
当接收到用户输入的搜索关键词时,将所述搜索关键词与各二级类目下的关键词库进行匹配;
若匹配成功,获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序。
2.如权利要求1所述的方法,其特征在于,所述对每个搜索词,根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算所述搜索词所对应的二级类目,具体包括:
对于各搜索词中的搜索历史记录中的搜索下载记录,判断所述搜索词的独立访问下载次数是否大于预设阈值;
如果所述搜索词的独立访问下载次数大于所述预设阈值,则根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算所述搜索词所对应的二级类目。
3.如权利要求2所述的方法,其特征在于,所述将所述搜索关键词与各二级类目下的关键词库进行匹配,具体包括:
检测各二级类目下的关键词库中是否存在与所述搜索关键词相匹配的关键词。
4.如权利要求2所述的方法,其特征在于,所述若匹配成功,获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序,具体包括:
若检测到某二级类目下的关键词库中存在与所述搜索关键词相匹配的关键词,则获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序。
5.如权利要求2所述的方法,其特征在于,所述采用分类器将各应用程序分为相应一级类目下的二级类目之后,所述方法还包括:
根据各应用程序对应的二级类目,获取各二级类目下的应用程序集合库。
6.如权利要求5所述的方法,其特征在于,所述获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序,具体包括:
根据与所述搜索关键词对应的二级类目,获取该二级类目下的应用程序集合库;
将该二级类目下的应用程序集合库中的所有应用程序作为与所述搜索关键词对应的应用程序。
7.如权利要求1所述的方法,其特征在于,还包括:
若匹配失败,计算所述搜索关键词和各应用程序的名称之间的文本相似度;
将所述文本相似度大于预设相似度的应用程序作为所述搜索关键词对应的应用程序。
8.一种利用二级类目下的关键词库搜索应用程序的装置,其特征在于,所述装置包括:
应用程序分类单元,对于各一级类目下的应用程序,用于利用一级类目下的各应用程序的描述信息,采用分类器将各应用程序分为相应一级类目下的二级类目;
搜索词分类单元,对每个搜索词,用于根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算搜索词所对应的二级类目;
二级类目关键词库生成单元,针对各二级类目,用于根据各搜索词所对应的二级类目,生成二级类目下的关键词库;
匹配单元,用于当接收到用户输入的搜索关键词时,将所述搜索关键词与各二级类目下的关键词库进行匹配;
应用程序获取单元,用于在检测到匹配成功时,获取与所述搜索关键词对应的二级类目下的应用程序作为与所述搜索关键词对应的应用程序。
9.如权利要求8所述的装置,其特征在于,所述搜索词分类单元,具体包括:
独立访问下载次数判断单元,对于各搜索词中的搜索历史记录中的搜索下载记录,用于判断所述搜索词的独立访问下载次数是否大于预设阈值;如果所述搜索词的独立访问下载次数大于所述预设阈值,则根据搜索历史记录中搜索词与各应用程序的点击关系,以及各应用程序所属的二级类目,计算所述搜索词所对应的二级类目。
10.如权利要求9所述的装置,其特征在于,所述匹配单元,具体用于检测各二级类目下的关键词库中是否存在与所述搜索关键词相匹配的关键词。
CN201510990108.4A 2015-12-24 2015-12-24 利用二级类目下的关键词库搜索应用程序的方法及装置 Pending CN106919576A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510990108.4A CN106919576A (zh) 2015-12-24 2015-12-24 利用二级类目下的关键词库搜索应用程序的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510990108.4A CN106919576A (zh) 2015-12-24 2015-12-24 利用二级类目下的关键词库搜索应用程序的方法及装置

Publications (1)

Publication Number Publication Date
CN106919576A true CN106919576A (zh) 2017-07-04

Family

ID=59460128

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510990108.4A Pending CN106919576A (zh) 2015-12-24 2015-12-24 利用二级类目下的关键词库搜索应用程序的方法及装置

Country Status (1)

Country Link
CN (1) CN106919576A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108920652A (zh) * 2018-07-03 2018-11-30 佛山市影腾科技有限公司 一种搜索方法、装置及终端
CN109462635A (zh) * 2018-09-25 2019-03-12 平安科技(深圳)有限公司 一种信息推送方法、计算机可读存储介质及服务器
CN110766486A (zh) * 2018-07-09 2020-02-07 北京京东尚科信息技术有限公司 确定物品类目的方法和装置
CN112257415A (zh) * 2020-09-29 2021-01-22 当趣网络科技(杭州)有限公司 语音搜索词库的方法、系统、电子装置和存储介质
CN112667770A (zh) * 2019-10-15 2021-04-16 北京京东尚科信息技术有限公司 一种对物品进行分类的方法和装置
WO2021092871A1 (zh) * 2019-11-13 2021-05-20 北京数字联盟网络科技有限公司 一种基于TextRank的应用偏好文本分类方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102591890A (zh) * 2011-01-17 2012-07-18 腾讯科技(深圳)有限公司 一种展示搜索信息的方法及搜索信息展示装置
CN103310343A (zh) * 2012-03-15 2013-09-18 阿里巴巴集团控股有限公司 商品信息发布方法和装置
CN103810168A (zh) * 2012-11-06 2014-05-21 深圳市世纪光速信息技术有限公司 检索应用的方法、装置及终端
CN103810198A (zh) * 2012-11-09 2014-05-21 阿里巴巴集团控股有限公司 一种商品信息的搜索方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102591890A (zh) * 2011-01-17 2012-07-18 腾讯科技(深圳)有限公司 一种展示搜索信息的方法及搜索信息展示装置
CN103310343A (zh) * 2012-03-15 2013-09-18 阿里巴巴集团控股有限公司 商品信息发布方法和装置
CN103810168A (zh) * 2012-11-06 2014-05-21 深圳市世纪光速信息技术有限公司 检索应用的方法、装置及终端
CN103810198A (zh) * 2012-11-09 2014-05-21 阿里巴巴集团控股有限公司 一种商品信息的搜索方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘帆: "《大学生KAB创业精讲》", 31 May 2013, 知识产权出版社 *
灵鸽: "《物尽其用 把你的智能手机用到极致》", 31 July 2012, 中国铁道出版社 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108920652A (zh) * 2018-07-03 2018-11-30 佛山市影腾科技有限公司 一种搜索方法、装置及终端
CN110766486A (zh) * 2018-07-09 2020-02-07 北京京东尚科信息技术有限公司 确定物品类目的方法和装置
CN109462635A (zh) * 2018-09-25 2019-03-12 平安科技(深圳)有限公司 一种信息推送方法、计算机可读存储介质及服务器
CN109462635B (zh) * 2018-09-25 2021-11-19 平安科技(深圳)有限公司 一种信息推送方法、计算机可读存储介质及服务器
CN112667770A (zh) * 2019-10-15 2021-04-16 北京京东尚科信息技术有限公司 一种对物品进行分类的方法和装置
WO2021092871A1 (zh) * 2019-11-13 2021-05-20 北京数字联盟网络科技有限公司 一种基于TextRank的应用偏好文本分类方法
CN112257415A (zh) * 2020-09-29 2021-01-22 当趣网络科技(杭州)有限公司 语音搜索词库的方法、系统、电子装置和存储介质

Similar Documents

Publication Publication Date Title
CN106919576A (zh) 利用二级类目下的关键词库搜索应用程序的方法及装置
KR102092691B1 (ko) 웹페이지 트레이닝 방법 및 기기, 그리고 검색 의도 식별 방법 및 기기
CN106919575B (zh) 应用程序搜索方法及装置
US8949227B2 (en) System and method for matching entities and synonym group organizer used therein
CN108319376B (zh) 一种优化商业词推广的输入联想推荐方法及装置
CN106445963B (zh) App平台的广告索引关键词自动生成方法和装置
CN104951468A (zh) 数据搜索处理方法和系统
CN103617213B (zh) 识别新闻网页属性特征的方法和系统
CN105302810A (zh) 一种信息搜索方法和装置
CN109634698A (zh) 菜单显示方法、装置、计算机设备及存储介质
CN106919588A (zh) 一种应用程序搜索系统及方法
CN107977445A (zh) 应用程序推荐方法及装置
CN110737821B (zh) 相似事件查询的方法、装置、存储介质和终端设备
CN105653949B (zh) 一种恶意程序检测方法及装置
KR20190128246A (ko) 검색 방법 및 장치 및 비-일시적 컴퓨터-판독가능 저장 매체
CN103870541A (zh) 社交网络用户兴趣挖掘方法和系统
CN110019660A (zh) 一种相似文本检测方法及装置
CN103713894A (zh) 一种用于确定用户的访问需求信息的方法与设备
CN107688563B (zh) 一种同义词的识别方法及识别装置
CN106919587A (zh) 应用程序搜索系统及方法
CN103744887A (zh) 一种用于人物搜索的方法、装置和计算机设备
CN103577547A (zh) 网页类型识别方法及装置
CN110389963A (zh) 基于大数据的渠道效果识别方法、装置、设备和存储介质
CN106997340A (zh) 词库的生成以及利用词库的文档分类方法及装置
CN111382385B (zh) 网页所属行业分类方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170704