CN110196833B - 应用程序的搜索方法、装置、终端及存储介质 - Google Patents

应用程序的搜索方法、装置、终端及存储介质 Download PDF

Info

Publication number
CN110196833B
CN110196833B CN201810242149.9A CN201810242149A CN110196833B CN 110196833 B CN110196833 B CN 110196833B CN 201810242149 A CN201810242149 A CN 201810242149A CN 110196833 B CN110196833 B CN 110196833B
Authority
CN
China
Prior art keywords
search
duty ratio
application program
word
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810242149.9A
Other languages
English (en)
Other versions
CN110196833A (zh
Inventor
李钊
吴德龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810242149.9A priority Critical patent/CN110196833B/zh
Publication of CN110196833A publication Critical patent/CN110196833A/zh
Application granted granted Critical
Publication of CN110196833B publication Critical patent/CN110196833B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了应用程序的搜索方法、装置、终端及存储介质,属于信息技术领域。该方法包括:接收应用程序的搜索词,获取所述搜索词在不同预设搜索策略中的搜索结果,从预设的匹配占比库中获取与所述搜索词相对应的匹配占比,根据所述匹配占比计算所述不同预设搜索策略中的搜索结果在结果列表中的位置占比权重,根据所述位置占比权重为所述搜索结果在结果列表中进行位置分配。本发明可以根据搜索词所表达的用户意图对不同搜索策略的搜索结果在结果列表中分配位置,避免了搜索结果的不准确,用户能够更加容易的从结果列表中找到需要的应用程序,而不需要经过过多的操作如翻页等,体验效果好。

Description

应用程序的搜索方法、装置、终端及存储介质
技术领域
本发明涉及信息技术领域,特别涉及一种应用程序的搜索方法、装置、终端及存储介质。
背景技术
随着智能手机等智能移动终端的普及,应用程序(Application,简称为APP)的使用越来越多,用户获取应用程序主要是通过安装在智能移动终端上的应用程序下载平台,如腾讯手机管家。在应用程序下载平台上进行应用程序的搜索时,通过应用程序下载平台的输入窗口输入搜索词,应用程序下载平台查找出与该搜索词相匹配的应用程序并经过排序后将结果展示给用户。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
相关技术中,在查找以及将查找出的应用程序进行排序以便展示给用户时,忽略了搜索词所反映出的用户意图,而不同的搜索词表达的用户意图往往大相径庭,传统的搜索方法忽略了搜索词的这种差异而将所有的搜索词一视同仁的采用相同的召回(某款应用程序出现在某个搜索词的搜索结果中,则称在该搜索词下“召回”了该应用程序)和排序方法,导致搜索效果差,有时甚至丢失重要的搜索结果,而用户在寻找其需求的应用程序时需要进行翻页等其他更多的操作,导致用户的搜索体验差。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种应用程序的搜索方法、装置、终端及存储介质。所述技术方案如下:
一方面,本发明实施例提供了一种应用程序的搜索方法,所述方法包括:
接收应用程序的搜索词,
获取所述搜索词在不同预设搜索策略中的搜索结果,
从预设的匹配占比库中获取与所述搜索词相对应的匹配占比,
根据所述匹配占比计算所述不同预设搜索策略中的搜索结果在结果列表中的位置占比权重,
根据所述位置占比权重为所述搜索结果在结果列表中进行位置分配。
另一方面,本发明实施例提供了一种应用程序的搜索装置,所述装置包括:
接收模块,用于接收所述应用程序的搜索词,
第一获取模块,用于获取所述搜索词在不同预设搜索策略中的搜索结果,
第二获取模块,用于从预设的匹配占比库中获取与所述搜索词相对应的匹配占比,
计算模块,用于根据所述匹配占比计算所述不同预设搜索策略中的搜索结果在结果列表中的位置占比权重,
分配模块,用于根据所述位置占比权重为所述搜索结果在结果列表中进行位置分配。
再一方面,本发明实施例还提供了一种终端,包括处理器和存储装置;
所述存储装置,用于存储计算机程序指令;
所述处理器,调用所述计算机程序指令,用于接收应用程序的搜索词,
获取所述搜索词在不同预设搜索策略中的搜索结果,
从预设的匹配占比库中获取与所述搜索词相对应的匹配占比,
根据所述匹配占比计算所述不同预设搜索策略中的搜索结果在结果列表中的位置占比权重,
根据所述位置占比权重为所述搜索结果在结果列表中进行位置分配。
本发明实施例还提供了一种计算机存储介质,该计算机存储介质存储有计算机程序指令,该计算机程序指令被执行时,实现上述应用程序的搜索方法。
本发明实施例提供的技术方案带来的有益效果是:
通过接收应用程序的搜索词,获取该搜索词在不同预设搜索策略中的搜索结果,然后从预设的匹配占比库中获取与搜索词相对应的匹配占比,并根据该匹配占比计算不同预设搜索策略中的搜索结果在结果列表中的位置占比权重,基于计算的位置占比权重为不同预设搜索策略中的搜索结果在结果列表中进行位置分配,使得可以根据搜索词所表达的用户意图对不同搜索策略的搜索结果在结果列表中分配位置,避免了搜索结果的不准确,用户能够更加容易的从结果列表中找到需要的应用程序,而不需要经过过多的操作如翻页等,体验效果好;此外,还能使得不同搜索策略的搜索结果能够合理、公平的分配到结果列表中的位置,避免了搜索结果的遗漏。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种应用程序的搜索方法的流程图;
图2是本发明实施例提供的另一种应用程序的搜索方法的流程图;
图3是本发明实施例提供的又一种应用程序的搜索方法的流程图;
图4是本发明实施例提供的基于文本相似的搜索策略获取与该搜索策略相对应的搜索结果的方法的流程图;
图5是本发明实施例提供的基于语义分析的搜索策略获取与该搜索策略相对应的搜索结果的方法的流程图;
图6是本发明实施例提供的一种应用程序的搜索装置的结构示意图;
图7是本发明实施例提供的另一种应用程序的搜索装置的结构示意图;
图8是本发明实施例提供的又一种应用程序的搜索装置的结构示意图;
图9是本发明实施例提供的又一种应用程序的搜索装置的结构示意图;
图10是本发明实施例提供的又一种应用程序的搜索装置的结构示意图;
图11是本发明实施例提供的一种应用程序的搜索装置的整体框架图;
图12是本发明实施例提供的一种终端的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
图1是根据本发明一个实施例的应用程序的搜索方法的流程图。需要说明的是,本发明实施例的应用程序的搜索方法可应用于本发明实施例的应用程序的搜索装置。该应用程序的搜索装置可配置于终端中的应用程序下载平台如腾讯手机管家,其中,该终端可以是手机、平板电脑、掌上电脑及个人数字助理等具有各种操作系统的硬件设备。例如,该应用程序的搜索装置可配置于手机的腾讯手机管家中。
如图1所示,该应用程序的搜索方法可以包括:
S101,获取应用程序的搜索词。
举例而言,假设本发明实施例的应用程序的搜索方法应用于移动终端中的应用程序下载平台如腾讯手机管家,该应用程序下载平台中可为用户提供针对应用程序的搜索输入框,用户可在该搜索输入框中输入针对需要搜索的应用程序的搜索词,并在检测到用户完成输入操作时,获取该用户输入的搜索词。可以理解,该搜索词即为关于应用程序的搜索词,例如,该搜索词可以是但不限于应用程序的具体名称、或部分名称、或针对应用程序的评论、或应用程序的标签、或应用程序的开发者等。
在本发明实施例中,用户可以通过触屏、语音等方式在搜索输入框中输入应用程序的搜索词,具体的,当用户输入语音时,可通过语音识别从语音中提取应用程序的搜索词,当用户输入图片时,可通过图片识别从图片中提取应用程序的搜索词,当用户输入为文字时可以直接将输入的文字提取为搜索词。
S102,获取所述搜索词在不同预设搜索策略中的搜索结果。
在本发明实施例中,移动终端中设有至少一种预设搜索策略,每种预设搜索策略均能根据获取的应用程序的搜索词从应用程序召回库中进行应用程序的召回,被召回的应用程序即为与该搜索策略相对应的搜索结果。其中,在本发明的实施例中,上述应用程序召回库可理解为应用程序的数据库,该召回库中含有大量的应用程序的基础信息(如应用程序的名称、应用程序的版本、应用程序的评论和描述等文本信息、应用程序的下载文件等),且该应用程序召回库还具有召回互联网中应用程序的功能。
举例而言,移动终端中预设有A,B,C三种搜索策略,在获取到应用程序的搜索词后,移动终端同时基于预设的A,B,C三种搜索策略进行应用程序的召回,其中,A搜索策略根据该搜索词的应用程序召回结果为搜索结果1,B搜索策略根据该搜索词的应用程序召回结果为搜索结果2,C搜索策略根据该搜索词的应用程序召回结果为搜索结果3。可以理解的,在应用程序的召回动作结束时,移动终端获取到搜索结果1,搜索结果2和搜索结果3,且搜索结果1,搜索结果2和搜索结果3分别与预设A搜索策略,预设B搜索策略和预设C搜索策略相对应。
S103,从预设的匹配占比库中获取与所述搜索词相对应的匹配占比。
在本发明实施例中,移动终端中预先设有匹配占比库,该匹配占比库用于存储搜索词与匹配占比的对应关系,其中,匹配占比可以根据各搜索词的历史搜索记录获得,该匹配占比用于从搜索词的历史搜索记录中获取搜索词所体现的用户意图。
S104,根据所述匹配占比计算所述不同预设搜索策略中的搜索结果在结果列表中的位置占比权重。
具体而言,在从预设的匹配占比库中获取到与当前搜索词相对应的匹配占比后,计算多种预设搜索策略中与每种搜索策略相对应的搜索结果在结果列表中的位置占比权重。
举例而言,移动终端在获取到应用程序的搜索词后,同时基于预设的A,B,C三种搜索策略进行应用程序的召回,并获得与预设A搜索策略,预设B搜索策略和预设C搜索策略相对应搜索结果1,搜索结果2和搜索结果3。在获取到搜索结果之后,进一步根据当前搜索词从预设的匹配占比库中获取匹配占比,然后根据获取的匹配占比分别计算搜索结果1,搜索结果2和搜索结果3在结果列表中的位置占比权重。如计算结果为,预设A搜索策略的搜索结果1的位置占比权重为0.2,预设B搜索策略的搜索结果2的位置占比权重为0.5,预设C搜索策略的搜索结果3的位置占比权重为0.3。
S105,根据所述位置占比权重为所述搜索结果在结果列表中进行位置分配。
需要说明的是,本步骤中的搜索结果为与每种搜索策略对应的搜索结果,如包含搜索结果1,搜索结果2和搜索结果3。
具体而言,在计算出不同预设搜索策略中的搜索结果在结果列表中的位置占比权重之后,根据各位置占比权重为各搜索结果在结果列表中进行位置分配。
举例而言,计算结果为预设A搜索策略的搜索结果1的位置占比权重为0.2,预设B搜索策略的搜索结果2的位置占比权重为0.5,预设C搜索策略的搜索结果3的位置占比权重为0.3,结果列表的可用位置数为10,则为预设A搜索策略的搜索结果1在结果列表中分配的位置数为0.2*10=2,为预设B搜索策略的搜索结果2在结果列表中分配的位置数为0.5*10=5,为预设B搜索策略的搜索结果3在结果列表中分配的位置数为0.3*10=3。
综上所述,本实施例的应用程序的搜索方法,通过接收应用程序的搜索词,获取该搜索词在不同预设搜索策略中的搜索结果,然后从预设的匹配占比库中获取与搜索词相对应的匹配占比,并根据该匹配占比,计算不同预设搜索策略中的搜索结果在结果列表中的位置占比权重,基于计算的位置占比权重为不同预设搜索策略中的搜索结果在结果列表中进行位置分配,可以确保每种搜索策略的搜索结果都能存在于结果列表中,从而避免了由于某种搜索策略的搜索结果过长,其它搜索策略的搜索结果无法存在于结果列表中的问题,使得不同搜索策略的搜索结果能够合理、公平的分配到结果列表中的位置,避免了搜索结果的遗漏。
另外,匹配占比刻画了搜索词所体现的用户意图,因此基于匹配占比计算出的位置占比权重能够将不同搜索策略的搜索结果结合用户的意图进行结果列表的位置分配,从而在结果列表中分配更多的位置给与用户意图更接近的搜索策略的搜索结果,避免了搜索结果的不准确,用户能够更加容易的从结果列表中找到需要的应用程序,而不需要经过过多的操作如翻页等,体验效果好。
请参阅图2,其示出了本发明实施例提供的另一种应用程序的搜索方法的流程图。本实施例的应用程序的搜索方法可应用于本发明实施例的应用程序的搜索装置。该应用程序的搜索装置可配置于移动终端中的应用程序下载平台如腾讯手机管家,其中,该移动终端可以是手机、平板电脑、掌上电脑及个人数字助理等具有各种操作系统的硬件设备。例如,该应用程序的搜索装置可配置于手机的腾讯手机管家中。
如图2所示,该应用程序的搜索方法可以包括:
S201,根据各搜索词的历史搜索记录和应用程序的基础信息,获取各搜索词的匹配占比,并基于所述搜索词和匹配占比生成预设的匹配占比库。
其中,上述应用程序的基础信息包括应用程序的名称、应用程序的版本、应用程序的评论和描述等文本信息、应用程序的下载文件等,该应用程序的基础信息可以存储在应用程序召回库中。
具体而言,在移动终端开启应用程序下载平台访问应用程序下载平台,如用户使用手机开启腾讯手机管家,用户可以在应用程序下载平台的搜索输入框中输入搜索词,应用程序下载平台根据该搜索词搜索应用程序召回库并将搜索结果返回至应用程序下载平台中,应用程序下载平台进一步展示应用程序的搜索结果,用户可以在该搜索结果中点击查看或者点击下载应用程序。那么在大量用户的搜索过程中,应用程序下载平台可以对各个搜索词的搜索历史进行记录,得到各搜索词的历史搜索记录,如应用程序下载平台可以通过日志记录该历史搜索记录。
作为一种示例,可以根据各搜索词的历史搜索记录中的历史下载记录和应用程序的基础信息中的名称信息,获取各搜索词的匹配占比。
具体而言,用户在应用程序下载平台中输入搜索词进行搜索获得搜索结果后,其可能点击下载搜索结果中的某些应用程序也可能不下载应用程序,应用程序下载平台则可以记录各个搜索词的下载情况,比如用户A搜索“聊天”,在搜索结果页中下载了应用程序“QQ”,而用户B搜索“聊天”,则可能在搜索结果页中下载了应用程序“微信”,通过对大量用户的历史下载行为的记录,则可得到对各搜索词的历史下载记载。具体实施中,该历史下载记录可以以历史下载日志的形式存储在应用程序下载平台中。
在本发明实施例中,可以根据各搜索词的历史下载记录中搜索词和应用程序的基础信息中的名称信息,获取各搜索词的匹配占比。
具体而言,可以计算各搜索词的历史下载记录中的搜索词和应用程序的基础信息中的名称之间的文本相似比例,以计算出的文本相似比例作为该搜索词的匹配占比。
举例而言,搜索词“淘宝”的历史下载记载中包含的应用程序有10个,分别为“手机淘宝,淘宝HD,手机天猫,支付宝,爱淘宝,唯品会,农村淘宝,蘑菇街,手机京东,拼多多”,其中,在下载的应用程序的名称中含有“淘宝”字样的应用程序有4个,分别为“手机淘宝,淘宝HD,爱淘宝,农村淘宝”,则搜索词“淘宝”的历史下载记录中,“淘宝”和应用程序的基础信息中的名称之间的文本相似比例为4/10即0.4,该数值0.4即为搜索词“淘宝”的匹配占比。
在获取到各搜索词的匹配占比后,基于搜索词和匹配占比生成预设的匹配占比库,该匹配占比库中存储的是搜索词与匹配占比的对应关系,如可以以列表的形式存储。
在搜索该预设的匹配占比库时,通过将当前搜索词与匹配占比库中的搜索词相匹配,从而获得当前搜索词的匹配占比。
S202,获取应用程序的搜索词。
当用户在应用程序下载平台中输入应用程序的搜索词后,移动终端获取该搜索词,可以理解的,该搜索词为关于应用程序的搜索词。
S203,获取搜索词在不同预设搜索策略中的搜索结果。
在本发明实施例中,移动终端中预先设有至少一种预设搜索策略,每种预设搜索策略均能根据获取的应用程序的搜索词从应用程序召回库中进行应用程序的召回,被召回的应用程序即为与该搜索策略相对应的搜索结果。其中,在本发明的实施例中,上述应用程序召回库可理解为应用程序的数据库,该召回库中含有大量的应用程序的基础信息(如应用程序的名称、应用程序的版本、应用程序的评论和描述等文本信息、应用程序的下载文件等),且该应用程序召回库还具有召回互联网中应用程序的功能。
S204,从预设的匹配占比库中获取与搜索词相对应的匹配占比。
具体而言,在获取到搜索词在不同预设搜索策略中的搜索结果后,从步骤S201生成的预设的匹配占比库中搜索与当前搜索词相对应的匹配占比。
需要说明的是,步骤S203和步骤S204可以同时执行,也可以先执行步骤S204,再执行步骤S203,本发明对此不作具体限制。
S205,根据匹配占比,计算不同预设搜索策略中的搜索结果在结果列表中的位置占比权重。
作为一种示例,可以将匹配占比指定为第一搜索策略的搜索结果在结果列表中的位置占比权重,
计算基尼系数,基于所述基尼系数和匹配占比计算剩余各搜索策略的搜索结果在结果列表中的位置占比权重,其中,所述基尼系数的计算公式如下:
Figure BDA0001605578190000081
其中,pi为各搜索词的历史下载记录中,某一应用程序的下载量占搜索词的历史下载记录中的所有应用程序总下载量的比值。
其中,第一搜索策略可以为移动终端中的任意一个预设搜索策略,剩余各搜索策略为移动终端中除上述第一搜索策略之外的各个搜索策略。
举例而言,用户在应用程序下载平台中输入搜索词“X”,预设A搜索策略根据该搜索词“X”,获得搜索结果1,预设B搜索策略根据该搜索词“X”,获得搜索结果2,预设C搜索策略根据该搜索词“X”,获得搜索结果3,该搜索词“X”在预设的匹配占比库中获取的匹配占比为0.4。接下来则将该搜索词的匹配占比0.4指定为预设A搜索策略的搜索结果1在结果列表中的位置占比权重,并结合匹配占比和计算的基尼系数分别确定预设B搜索策略的搜索结果2和预设C搜索策略的搜索结果3在结果列表中的位置占比权重。
对于基尼系数可以采用计算公式:
Figure BDA0001605578190000091
计算,其中,pi为各搜索词的历史下载记录中,某一应用程序的下载量占搜索词的历史下载记录中的所有应用程序总下载量的比值。比如,搜索词“微信”的历史下载记录中包含的已下载的应用程序为“微信、QQ、陌陌”,其中,应用程序微信的下载量为90,应用程序QQ的下载量为7,应用程序陌陌的下载量为3,则搜索词“微信”的历史下载记录中的所有应用程序总下载量为90+7+3=100,p(微信)=90/100,p(QQ)=7/100,p(陌陌)=3/100,具体的,可以参见如下表1。
表1(搜索词为“微信”)
Figure BDA0001605578190000092
本发明实施例中,在计算剩余各搜索策略的搜索结果在结果列表中的位置占比权重时,基于匹配占比与基尼系数的乘积计算得到。
举例而言,搜索词“X”的匹配占比为x,搜索词“X”的基尼系数为y,移动终端中设置有预设A搜索策略,预设B搜索策略和预设C搜索策略,其中预设A搜索策略的搜索结果1在结果列表中的位置占比权重指定为搜索词的匹配占比即为x,预设B搜索策略的搜索结果2在结果列表中位置占比权重为(1-x)*y,预设C搜索策略的搜索结果3在结果列表中的位置占比权重为(1-x)*(1-y)。
S206,根据位置占比权重为搜索结果在结果列表中进行位置分配。
具体而言,在计算得到不同搜索策略的搜索结果在结果列表中的位置占比权重后,根据该位置占比权重为各个搜索策略的搜索结果分配其在结果列表中的位置数。
举例而言,在经过步骤S205后,计算得到预设A搜索策略的搜索结果1在结果列表中的位置占比权重为x,预设B搜索策略的搜索结果2在结果列表中位置占比权重为(1-x)*y,预设C搜索策略的搜索结果3在结果列表中的位置占比权重为(1-x)*(1-y),假设结果列表的总位置数为a,则搜索结果1在结果列表中分配到的位置数为a*x,搜索结果2在结果列表中分配到的位置数为(1-x)*y*a,搜索结果3在结果列表中分配到的位置数为(1-x)*(1-y)*a。
在具体实施过程中,根据位置占比权重为不同搜索策略的搜索结果在结果列表中分配位置之后,还可以对搜索结果进行排序,以使得在将搜索结果展示给用户时,每一展示页中均能包含不同搜索策略的搜索结果,从而方便用户快速的找到需要的应用程序。
综上所述,本实施例的应用程序的搜索方法,可以确保每种搜索策略的搜索结果都能存在于结果列表中,从而避免了由于某种搜索策略的搜索结果过长,其它搜索策略的搜索结果无法存在于结果列表中的问题,使得不同搜索策略的搜索结果能够合理、公平的分配到结果列表中的位置,避免了搜索结果的遗漏。
另外,匹配占比刻画了搜索词所体现的用户意图,因此基于匹配占比计算出的位置占比权重能够将不同搜索策略的搜索结果结合用户的意图进行结果列表的位置分配,从而在结果列表中分配更多的位置给与用户意图更接近的搜索策略的搜索结果,避免了搜索结果的不准确,用户能够更加容易的从结果列表中找到需要的应用程序,而不需要经过过多的操作如翻页等,体验效果好。
在本发明中,预先设置在移动终端中的预设搜索策略可以包括基于文本相似的搜索策略,也可以包括基于语义分析的搜索策略,当然可以理解的,也可以同时包括基于文本相似的搜索策略和基于语义分析的搜索策略。下面以移动终端中同时设有基于文本相似的搜索策略和基于语义分析的搜索策略,来说明本发明的应用程序的搜索方法。
具体的,请参阅图3,其示出了本发明实施例提供的另一种应用程序的搜索方法的流程图,本实施例的应用程序的搜索方法可应用于本发明实施例的应用程序的搜索装置。该应用程序的搜索装置可配置于移动终端中的应用程序下载平台如腾讯手机管家,其中,该移动终端可以是手机、平板电脑、掌上电脑及个人数字助理等具有各种操作系统的硬件设备。例如,该应用程序的搜索装置可配置于手机的腾讯手机管家中。
如图3所示,该应用程序的搜索方法可以包括:
S301,获取应用程序的搜索词。
S302,获取搜索词在基于文本相似的搜索策略中的搜索结果。
具体的,请参阅图4,其示出了基于文本相似的搜索策略获取与该搜索策略相对应的搜索结果的方法的流程图。
S3021,获取应用程序的热度值。
在本发明实施例中,应用程序的热度值用于反映应用程序在其历史搜索中被关注的程度,可以通过历史搜索日志计算出应用程序的热度值。
作为一个示例,应用程序的热度值可以包括第一热度值和/或第二热度值。其中,第一热度值考虑的是应用程序在所有搜索词中的下载情况,其并不与某一特定的搜索词相对应。第二热度值则考虑的是由搜索词到应用程序的下载情况,体现的是用户的搜索习惯,即用户输入某一搜索词,下载某一应用程序的情况。
具体的,第一热度值可以通过以下步骤计算得到:
根据应用程序的历史下载记录,获取与该应用程序相对应的历史下载量,
对上述历史下载量做归一化处理,得到所述第一热度值,该第一热度值的范围为[0,1]。
其中,应用程序的历史下载量为应用程序在所有搜索词中的下载量的总和。
第二热度值可以通过以下步骤计算得到:
根据各搜索词的历史下载记录,获取与各搜索词相对应的每个应用程序的下载量以及与各搜索词相对应的所有应用程序的下载量总和。
计算与各搜索词相对应的每个应用程序的下载量在所有应用程序的下载量总和中的占比,该占比即为第二热度值。
具体而言,用户在应用程序下载平台中输入搜索词进行搜索获得搜索结果后,其可能点击下载搜索结果中的某些应用程序也可能不下载应用程序,应用程序下载平台则可以记录各个搜索词的下载情况,比如用户A搜索“聊天”,在搜索结果页中下载了应用程序“QQ”,而用户B搜索“聊天”,则可能在搜索结果页中下载了应用程序“微信”,通过对大量用户的历史下载行为的记录,则可得到对各搜索词的历史下载记录,该历史下载记录中包含与搜索词相对应的已下载的所有应用程序,以及每个应用程序在该搜索词下的下载量。比如,搜索词“聊天”的历史下载记录中记载的已下载的应用程序为微信和QQ,其中,微信在搜索词“聊天”下的下载量为a,QQ在搜索词“聊天”下的下载量为b,则可以得到,与搜索词“聊天”相对应于的应用程序微信的第二热度值为a/(a+b),与搜索词“聊天”相对应的应用程序QQ的第二热度值为b/(a+b)。
S3022,基于第一深度神经网络模型计算搜索词与应用程序的基础信息中的名称信息之间的融合相似度。
为了使得基于文本相似的搜索策略获取的搜索结果能够更加的稳定、准确,在本发明的一个实施例中,在计算搜索词与应用程序的基础信息的名称信息之间的相似度时,同时考虑了多种计算文本相似度的方法,并对每种方法计算的文本相似度结果进行融合,得到融合相似度。在对每种方法计算的文本相似度结果进行融合时,可根据第一深度神经网络模型计算融合相似度。
作为一个示例,上述计算文本相似度的方法包括基于切词占比的计算方法、基于全名匹配的计算方法、基于字符串长度的计算方法、基于编辑距离的计算方法和基于jaro距离的计算方法中的至少一种。
在本发明的一个实施例中,分别采用基于切词占比的计算方法、基于全名匹配的计算方法、基于字符串长度的计算方法、基于编辑距离的计算方法和基于jaro距离的计算方法计算搜索词与应用程序的名称之间的文本相似度,然后基于计算出来的5个相似度获得融合相似度。
在基于计算出来的5个相似度获得融合相似度时,可根据第一深度神经网络模型如是逻辑回归(Logistic Regression,LR)模型计算。
S3023,根据热度值和融合相似度计算应用程序的下载概率,并基于该应用程序的下载概率获取搜索结果。
具体的,在根据步骤S3021获得第一热度值和/或第二热度值,以及根据步骤S3022获得搜索词与应用程序的名称之间的融合相似度之后,计算应用程序的下载概率,并依据该下载概率获得搜索结果。
作为一个示例,在计算应用程序的下载概率时,可基于第二深度神经网络模型,该第二深度神经网络模型也可以为逻辑回归(Logistic Regression,LR)模型。将第一热度值、第二热度值和融合相似度作为模型的输入特征,经过模型计算出应用程序的下载概率,并基于下载概率召回应用程序,获得搜索结果。
S303,获取搜索词在基于语义分析的搜索策略中的搜索结果。
具体的,请参阅图5,其示出了基于语义分析的搜索策略获取与该搜索策略相对应的搜索结果的方法的流程图。
S3031,获取与应用程序的基础信息中的描述信息相对应的词集。
具体而言,可以对应用程序的描述信息文本进行分词,去标点符号,去停用词处理后,得到与应用程序的描述信息文本相对应的词集。
S3032,基于机器学习模型计算所述词集中各词汇的权重,并根据所述权重对所述词集进行降维处理。
将步骤S3031获取的词集输入至机器学习模型中,抽离出词汇的特征集,该特征集中包括修正词频特征、类方差特征和类基尼特征,然后通过机器学习算法计算出词集中各词汇的权重,其中,机器学习模型可以为随机森林模型(RF,RandomForest)。
修正词频特征可以通过如下公式计算得到:
Figure BDA0001605578190000131
其中,max为词汇在各类应用程序中的最大相对词频。
类方差特征和类基尼特征均是基于归一化处理后的词汇的相对词频计算得到。具体的,类方差特征可以通过如下公式计算得到:
Figure BDA0001605578190000132
其中,xi为词汇在某一类应用程序中的相对词频,x’为词汇在各类应用程序中的相对词频的平均值,n为出现词汇的应用程序的类别数。
类基尼特征可以通过如下公式计算得到:
Figure BDA0001605578190000133
其中,yi为词汇在某一类应用程序中的相对词频,n为出现词汇的应用程序的类别数。
举例而言,如下表2所示,词汇“战争”进入机器学习模型后,经分析其在三类应用程序的描述信息文本中出现,分别为类1,类2和类3。其中,类1,类2和类3中分别有50个应用程序的描述信息文本涉及该词汇。在类1的50个应用程序的描述信息文本中词汇“战争”出现的次数为100次,在类2的50个应用程序的描述信息文本中词汇“战争”出现的次数为20次,在类3的50个应用程序的描述信息文本中词汇“战争”出现的次数为15次,则词汇“战争”在类1中的相对词频为100/50=2,在类2中的相对词频为20/50=0.4,在类3中的相对词频为15/50=0.3,该词汇“战争”的修正词频计算公式中,max的值取为最大相对词频2。
表2
Figure BDA0001605578190000141
在计算出词集中各词汇的权重后,根据该权重对词集进行降维处理。具体的,在通过机器学习模型获得词集中各词汇的权重之后,摒弃低权重的词汇,得到与应用程序的描述信息文本相对应的修正词集。
S3033,基于语义分析算法计算搜索词与所述词集的关联度。
具体而言,上述语义分析算法可以为改进的潜在语义分析模型(LSA,LatentSemantic Analysis)模型,该改进的潜在语义分析模型的算法原理如下:
D2Wnm=Umm*Smn*Vnn=>D2W'nm=Umk*Skk*Vkn
对于新的词w:W1m*VTmk*S-1kk=U1k
对于新文档d:S-1kk*UTkn*Dn1=Vk1。
S3034,根据所述关联度获取搜索结果。
具体的,在计算出搜索词与词集的关联度后,基于该关联度获取搜索结果。
S304,从预设的匹配占比库中获取与搜索词相对应的匹配占比。
S305,根据匹配占比计算基于文本相似的搜索策略和基于语义分析的搜索策略的搜索结果分别在结果列表中的位置占比权重。
具体而言,将匹配占比指定为基于文本相似的搜索策略获得的搜索结果在结果列表中的位置占比权重,比如,从匹配占比库中获取到当前搜索词的匹配占比为x,则基于文本相似的搜索策略的搜索结果在结果列表中的位置占比权重为x。
结合匹配占比和基尼系数计算基于语义分析的搜索策略获得的搜索结果在结果列表中的位置占比权重。具体的,当前搜索词的基尼系数可以参照前述实施例中的计算方式获得,在此不再赘述,比如,当前搜索词的基尼系数计算为a。则基于语义分析的搜索策略的搜索结果在结果列表中的位置占比权重为(1-x)*a。
当然,可以理解的,若移动终端中还另一种搜索策略,则另一种搜索策略的搜索结果在结果列表中的位置占比权重为(1-x)*(1-a)。
S306,根据位置占比权重为不同搜索策略的搜索结果在结果列表中进行位置分配。
综上所述,本实施例的应用程序的搜索方法,可以确保基于文本相似的搜索策略的搜索结果和基于语义分析的搜索策略的搜索结果都能存在于结果列表中,从而避免了由于某种搜索策略的搜索结果过长,只能返回其中某种搜索策略的搜索结果的问题,使得不同搜索策略的搜索结果能够合理、公平的分配到结果列表中的位置,避免了搜索结果的遗漏。
另外,匹配占比刻画了搜索词所体现的用户意图,因此基于匹配占比计算出的位置占比权重能够将不同搜索策略的搜索结果结合用户的意图进行结果列表的位置分配,从而在结果列表中分配更多的位置给与用户意图更接近的搜索策略的搜索结果,避免了搜索结果的不准确,用户能够更加容易的从结果列表中找到需要的应用程序,而不需要经过过多的操作如翻页等,体验效果好。
与上述几种实施例提供的应用程序的搜索方法相对应,本发明的一种实施例还提供一种应用程序的搜索装置,由于本发明实施例提供的应用程序的搜索装置与上述几种实施例提供的应用程序的搜索方法相对应,因此在前述应用程序的搜索方法的实施方式也适用于本实施例提供的应用程序的搜索装置,在本实施例中不再详细描述。图6是根据本发明一个实施例的应用程序的搜索装置的结构示意图。如图6所示,该应用程序的搜索装置可以包括接收模块601,第一获取模块602,第二获取模块603,第一计算模块604,分配模块605。
具体的,接收模块601可以用于接收应用程序的搜索词。
第一获取模块602可以用于获取搜索词在不同预设搜索策略中的搜索结果。在本发明的实施例中,预设搜索策略可以包括基于语义分析的搜索策略和基于语义分析的搜索策略。
第二获取模块603可以用于从预设的匹配占比库中获取与搜索词相对应的匹配占比。
计算模块604可以用于根据匹配占比计算不同预设搜索策略中的搜索结果在结果列表中的位置占比权重。
具体而言,在本发明的一个实施例中,如图7所示,该第一计算模块604可包括指定模块6041,第一计算子模块6042和第二计算子模块6043。其中,指定模块6041可用于将匹配占比指定为第一搜索策略的搜索结果在结果列表中的位置占比权重。第一计算子模块6042可用于计算基尼系数,该基尼系数的计算公式如下:
Figure BDA0001605578190000161
其中,pi为各搜索词的历史下载记录中,某一应用程序的下载量占所述历史下载记录中的所有应用程序总下载量的比值。第二计算子模块6043可用于基于基尼系数和匹配占比计算剩余各搜索策略的搜索结果在结果列表中的位置占比权重。
分配模块605可以用于根据位置占比权重为搜索结果在结果列表中进行位置分配。
作为一种示例,如图8所示,该应用程序的搜索装置还可以包括生成模块801,生成模块801可以用于根据各搜索词的历史搜索记录和应用程序的基础信息获取各搜索词的匹配占比,并基于所述搜索词和匹配占比生成预设的匹配占比库。在本发明的一个实施方式中,可以根据各搜索词的历史搜索记录中的历史下载记录和应用程序的基础信息中的名称信息,获取各搜索词的匹配占比,更具体的,可以根据各搜索词的历史下载记录中搜索词和应用程序的基础信息中的名称信息,获取各搜索词的匹配占比,如可以计算各搜索词的历史下载记录中的搜索词和应用程序的基础信息中的名称之间的文本相似比例,以计算出的文本相似比例作为该搜索词的匹配占比。在获取到各搜索词的匹配占比后,基于搜索词和匹配占比生成预设的匹配占比库,该匹配占比库中存储的是搜索词与匹配占比的对应关系,如可以以列表的形式存储。在搜索该预设的匹配占比库时,通过将当前搜索词与匹配占比库中的搜索词相匹配,从而获得当前搜索词的匹配占比。
作为一种示例,如图9所示,该应用程序的搜索装置还可以包括:第三获取模块901,第二计算模块902和第四获取模块903。其中,第三获取模块901可用于计算并获取应用程序的热度值。第二计算模块902可用于基于深度神经网络模型计算搜索词与应用程序的基础信息中的名称信息之间的融合相似度。第四获取模块903可用于根据热度值和融合相似度计算应用程序的下载概率,并基于应用程序的下载概率获取搜索结果。
作为一种示例,如图10所示,该应用程序的搜索装置还可以包括:第五获取模块1001,处理模块1002,第三计算模块1003和第六获取模块1004。其中,第五获取模块1001可用于获取与应用程序的文本相对应的词集。处理模块1002可用于基于机器学习模型获取词集中词汇的权重,并根据权重对所述词集进行降维处理。第三计算模块1003可用于基于语义分析算法计算搜索词与词集的关联度。第六获取模块1004可用于根据关联度获取搜索结果。
本发明实施例的应用程序的搜索装置,可通过接收模块接收应用程序的搜索词,第一获取模块获取该搜索词在不同预设搜索策略中的搜索结果,第二获取模块从预设的匹配占比库中获取与搜索词相对应的匹配占比,计算模块根据该匹配占比,计算不同预设搜索策略中的搜索结果在结果列表中的位置占比权重,分配模块基于计算的位置占比权重为不同预设搜索策略中的搜索结果在结果列表中进行位置分配,可以确保每种搜索策略的搜索结果都能存在于结果列表中,从而避免了由于某种搜索策略的搜索结果过长,其它搜索策略的搜索结果无法存在于结果列表中的问题,使得不同搜索策略的搜索结果能够合理、公平的分配到结果列表中的位置,避免了搜索结果的遗漏。
另外,匹配占比刻画了搜索词所体现的用户意图,因此基于匹配占比计算出的位置占比权重能够将不同搜索策略的搜索结果结合用户的意图进行结果列表的位置分配,从而在结果列表中分配更多的位置给与用户意图更接近的搜索策略的搜索结果,避免了搜索结果的不准确,用户能够更加容易的从结果列表中找到需要的应用程序,而不需要经过过多的操作如翻页等,体验效果好。
请参阅图11,其所示是本发明实施例提供的一种应用程序的搜索装置的整体框架图,如图11所示,该应用程序的搜索装置的整体框架可以包括数据单元1110、召回单元1120、排序单元1130和扩展单元1140。
数据单元1110是整个应用程序的搜索装置的基础,其中可以包括文本处理模块1112、搜索词处理模块1113和标签模块1111。文本处理模块1112用于文本的获取、文本的处理以及词汇的处理,文本的获取可以通过网页爬虫、接口获取以及行为日志获取,文本的处理包括切词、文本清洗和词汇白名单,词汇的处理包括词汇的标注、对词汇权重的获取及根据词汇的权重获得修正词集、词汇的拼音化等。搜索词处理模块1113用于搜索词的相关处理,包括搜索词的下载基尼的获取和匹配占比的获取,当然,搜索词处理模块1113还可以对搜索词进行其它的处理如获取搜索词的下载稳定性以及判断搜索词是否为特殊词。标签模块1111用于实现对应用程序的语义和功能的挖掘,为搜索召回提供必要的支撑。
召回单元1120用于根据搜索词和不同的搜索策略获得搜索结果即根据搜索词和不同的搜索策略对应用程序进行召回,并确保召回结果的全面性。召回单元1120可以包括文本召回模块1121、语义召回模块1122和基础召回模块1123,文本召回模块1121用于基于文本相似的搜索策略获得召回结果。语义召回模块1122用于基于语义分析的搜索策略获得召回结果。基础召回模块1123作为文本召回模块1121和语义召回模块1122的功能补充,其可以采用基于传统的倒排索引的方式获得召回结果。当然,为了使得召回结果更加的丰富、全面,召回单元还可以包括关联召回模块1124,该关联召回模块1124用于基于搜索词的类别名称的近义词获得名称和描述文本与该近义词相关度较高的应用程序作为召回结果。
排序单元1130可以用于实现对召回结果的排序,从而提升搜索结果的准确度。排序过程可以先对各个搜索策略的召回结果进行单独的排序,再根据搜索词的匹配占比对召回结果进行结果列表中的位置占比权重的计算和位置分配,从而融合形成最终的序列。当然,为了实现商业化目的和纠正机器排序可能存在的偏差,在序列输出前还可以对上述最终的序列进行人工干预。与上述召回单元1120相对应,排序单元1130可以包括模型排序模块1131、语义排序模块1132、同类排序模块1133、基础排序模块1134以及汇总排序模块1135。模型排序模块1131用于对文本召回模块1121的召回结果进行单独排序。语义排序模块1132用于对语义召回模块1122的召回结果进行单独排序。同类排序模块1133用于对关联召回模块1124的召回结果进行单独排序。基础排序模块1134用于对基础召回模块1123的召回结果进行单独排序。汇总排序模块1135用于根据匹配占比对上述模型排序模块1131、语义排序模块1132、同类排序模块1133和基础排序模块1134单独排序后的召回结果进行结果列表中的位置占比权重的计算并根据位置占比权重为单独排序后的召回结果进行结果列表的位置分配。当然,汇总排序模块1135还可以同时考虑匹配占比和商业化目的对各个排序模块单独排序后的召回结果进行结果列表中的位置占比权重的计算以及位置分配。
为了丰富搜索结果和形式,本实施例在排序单元1130之上还构建了扩展单元1140。扩展单元1140用于实现为用户推荐相关搜索词和相关主题的功能,以及收集用户的搜索习惯并将该搜索习惯反馈到用户账户的数据存储中,以实现搜索结果的迭代优化。扩展单元1140可以包括搜索词推荐模块1141、主题推荐模块1142、用户行为挖掘模块1143。搜索词推荐模块1141用于向用户推荐与当前搜索词相关的搜索词;主题推荐模块1142用于向用户推荐与根据当前搜索词确定的主题相关的主题;用户行为挖掘模块1143用于收集用户的搜索习惯,并将该搜索习惯反馈到用户账号的数据存储中。当然,扩展单元1140中还可以包括其他的功能模块,比如热词挖掘模块1144和商业化运营模块1145,其中,热词挖掘模块1144用于根据搜索词的热度值确定受关注度较高的搜索词,并将其标注为热词;商业化运营模块1145可以用于实现搜索的商业化,具体的,可以根据商业化目的,对其赋予相应的功能。
需要说明的是,为了保证数据的正常运行,提高发现badcase的速度以及提升迭代优化的效率,本实施例除了上述的数据单元1111、召回单元1120、排序单元1130和扩展单元外1140,还可以包括支持单元1150,该支持单元1150可以包括监控模块1151和收集模块1152。监控模块1151用于监控数据的运行,以及时发现badcase并处理。收集模块1152可以用于收集搜索词的下载记录、搜索词的转化率以及未覆盖的搜索词等。
需要说明的是,上述实施例提供的装置,在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
本实施例提供了一种终端,该终端可以用于执行上述各个实施例中提供的应用程序的搜索方法。参见图12,该终端1200包括:
终端1200可以包括RF(Radio Frequency,射频)电路1210、包括有一个或一个以上计算机可读存储介质的存储器1220、输入单元1230、显示单元1240、传感器1250、音频电路1260、WiFi(Wireless Fidelity,无线保真)模块1270、包括有一个或者一个以上处理核心的处理器1280、以及电源120等部件。本领域技术人员可以理解,图12中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
RF电路1210可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器1280处理;另外,将涉及上行的数据发送给基站。通常,RF电路1210包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM)卡、收发信机、耦合器、LNA(Low Noise Amplifier,低噪声放大器)、双工器等。此外,RF电路1210还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议,包括但不限于GSM(Global System of Mobile communication,全球移动通讯系统)、GPRS(General Packet Radio Service,通用分组无线服务)、CDMA(Code Division Multiple Access,码分多址)、WCDMA(Wideband Code DivisionMultiple Access,宽带码分多址)、LTE(Long Term Evolution,长期演进)、电子邮件、SMS(Short Messaging Service,短消息服务)等。
存储器1220可用于存储软件程序以及模块,处理器1280通过运行存储在存储器1220的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器1220可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端1200的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1220可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器1220还可以包括存储器控制器,以提供处理器1280和输入单元1230对存储器1220的访问。
输入单元1230可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,输入单元1230可包括触敏表面1231以及其他输入设备1232。触敏表面1231,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面1231上或在触敏表面1231附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面1231可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器1280,并能接收处理器1280发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面1231。除了触敏表面1231,输入单元1230还可以包括其他输入设备1232。具体地,其他输入设备1232可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元1240可用于显示由用户输入的信息或提供给用户的信息以及终端1200的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元1240可包括显示面板1241,可选的,可以采用LCD(Liquid Crystal Display,液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板1241。进一步的,触敏表面1231可覆盖显示面板1241,当触敏表面1231检测到在其上或附近的触摸操作后,传送给处理器1280以确定触摸事件的类型,随后处理器1280根据触摸事件的类型在显示面板1241上提供相应的视觉输出。虽然在图12中,触敏表面1231与显示面板1241是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面1231与显示面板1241集成而实现输入和输出功能。
终端1200还可包括至少一种传感器1250,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1241的亮度,接近传感器可在终端1200移动到耳边时,关闭显示面板1241和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端1200还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路1260、扬声器1261,传声器1262可提供用户与终端1200之间的音频接口。音频电路1260可将接收到的音频数据转换后的电信号,传输到扬声器1261,由扬声器1261转换为声音信号输出;另一方面,传声器1262将收集的声音信号转换为电信号,由音频电路1260接收后转换为音频数据,再将音频数据输出处理器1280处理后,经RF电路1210以发送给比如另一终端,或者将音频数据输出至存储器1220以便进一步处理。音频电路1260还可能包括耳塞插孔,以提供外设耳机与终端1200的通信。
WiFi属于短距离无线传输技术,终端1200通过WiFi模块1270可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图12示出了WiFi模块1270,但是可以理解的是,其并不属于终端1200的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器1280是终端1200的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器1220内的软件程序和/或模块,以及调用存储在存储器1220内的数据,执行终端1200的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器1280可包括一个或多个处理核心;优选的,处理器1280可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1280中。
终端1200还包括给各个部件供电的电源120(比如电池),优选的,电源可以通过电源管理系统与处理器1280逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源120还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,终端1200还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,终端的显示单元是触摸屏显示器,终端还包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行。所述一个或者一个以上程序包含用于执行以下操作的指令:接收应用程序的搜索词;获取所述搜索词在不同预设搜索策略中的搜索结果;从预设的匹配占比库中获取与所述搜索词相对应的匹配占比;根据所述匹配占比计算所述不同预设搜索策略中的搜索结果在结果列表中的位置占比权重;根据所述位置占比权重为所述搜索结果在结果列表中进行位置分配。
本发明实施例还提供了一种计算机存储介质,所述计算机存储介质可以存储有多条指令,所述指令适于由处理器加载并执行如上述各实施例中所述的应用程序的搜索方法,具体执行过程可参考前述实施例中相关内容的描述,在此不赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.应用程序的搜索方法,其特征在于,所述方法包括:
接收应用程序的搜索词;
获取所述搜索词在不同预设搜索策略中的搜索结果;
从预设的匹配占比库中获取与所述搜索词相对应的匹配占比;所述预设的匹配占比库用于存储搜索词与匹配占比的对应关系,所述匹配占比表征相应搜索词对应的历史下载记录中的搜索词和应用程序的名称之间的文本相似比例;
根据所述匹配占比计算所述不同预设搜索策略中的搜索结果在结果列表中的位置占比权重;
根据所述位置占比权重为所述搜索结果在结果列表中进行位置分配;
其中,所述根据所述匹配占比计算所述不同预设搜索策略中的搜索结果在结果列表中的位置占比权重,包括:
将所述匹配占比指定为第一搜索策略的搜索结果在结果列表中的位置占比权重;所述第一搜索策略为任一所述预设搜索策略;
计算所述搜索词的历史下载记录中,各应用程序的下载量占所述历史下载记录中的所有应用程序总下载量的比值的平方之和,得到目标和值;
计算数值1与所述目标和值之差,得到基尼系数;
基于所述基尼系数和匹配占比,计算剩余各搜索策略的搜索结果在结果列表中的位置占比权重;所述剩余各搜索策略为除所述第一搜索策略之外的各预设搜索策略。
2.根据权利要求1所述的应用程序的搜索方法,其特征在于,在所述接收应用程序的搜索词之前,所述方法还包括:
计算各搜索词的历史下载记录中的搜索词和应用程序的基础信息中的名称之间的文本相似比例,得到各搜索词的匹配占比,并基于所述搜索词和匹配占比的对应关系生成预设的匹配占比库。
3.根据权利要求1所述的应用程序的搜索方法,其特征在于,所述预设搜索策略包括基于文本相似的搜索策略,所述基于文本相似的搜索策略具体包括:
获取应用程序的热度值;
基于深度神经网络模型计算搜索词与应用程序的基础信息中的名称信息之间的融合相似度;
根据所述热度值和所述融合相似度计算应用程序的下载概率,并基于所述应用程序的下载概率获取搜索结果。
4.根据权利要求1所述的应用程序的搜索方法,其特征在于,所述预设搜索策略包括基于语义分析的搜索策略,所述基于语义分析的搜索策略具体包括:
获取与应用程序的基础信息中的描述信息相对应的词集;
基于机器学习模型计算所述词集中各词汇的权重,并根据所述权重对所述词集进行降维处理;
基于语义分析算法计算搜索词与所述词集的关联度;
根据所述关联度获取搜索结果。
5.应用程序的搜索装置,其特征在于,所述装置包括:
接收模块,用于接收所述应用程序的搜索词;
第一获取模块,用于获取所述搜索词在不同预设搜索策略中的搜索结果;
第二获取模块,用于从预设的匹配占比库中获取与所述搜索词相对应的匹配占比;所述预设的匹配占比库用于存储搜索词与匹配占比的对应关系,所述匹配占比表征相应搜索词对应的历史下载记录中的搜索词和应用程序的名称之间的文本相似比例;
计算模块,用于将所述匹配占比指定为第一搜索策略的搜索结果在结果列表中的位置占比权重,所述第一搜索策略为任一所述预设搜索策略;计算所述搜索词的历史下载记录中,各应用程序的下载量占所述历史下载记录中的所有应用程序总下载量的比值的平方之和,得到目标和值;计算数值1与所述目标和值之差,得到基尼系数;基于所述基尼系数和匹配占比,计算剩余各搜索策略的搜索结果在结果列表中的位置占比权重;所述剩余各搜索策略为除所述第一搜索策略之外的各预设搜索策略;
分配模块,用于根据所述位置占比权重为所述搜索结果在结果列表中进行位置分配。
6.根据权利要求5所述的应用程序的搜索装置,其特征在于,所述装置还包括生成模块,所述生成模块用于计算各搜索词的历史下载记录中的搜索词和应用程序的基础信息中的名称之间的文本相似比例,得到各搜索词的匹配占比,并基于所述搜索词和匹配占比的对应关系生成预设的匹配占比库。
7.根据权利要求5所述的应用程序的搜索装置,其特征在于,当所述预设搜索策略包括基于文本相似的搜索策略时,所述装置还包括:
第三获取模块,用于计算并获取应用程序的热度值;
第二计算模块,用于基于深度神经网络模型计算搜索词与应用程序的基础信息中的名称信息之间的融合相似度;
第四获取模块,用于根据所述热度值和所述融合相似度计算应用程序的下载概率,并基于所述应用程序的下载概率获取搜索结果。
8.根据权利要求5所述的应用程序的搜索装置,其特征在于,当所述预设搜索策略包括基于语义分析的搜索策略时,所述装置还包括:
第五获取模块,用于获取与应用程序的文本相对应的词集;
处理模块,用于基于机器学习模型获取所述词集中词汇的权重,并根据所述权重对所述词集进行降维处理;
第三计算模块,用于基于语义分析算法计算搜索词与所述词集的关联度;
第六获取模块,用于根据所述关联度获取搜索结果。
9.一种终端,其特征在于,包括处理器和存储装置;
所述存储装置,用于存储计算机程序指令;
所述处理器,调用所述计算机程序指令,以实现如权利要求1-4任一项所述的方法。
10.一种计算机存储介质,其特征在于,该计算机存储介质存储有计算机程序指令,该计算机程序指令被执行时,实现如权利要求1-4任一项所述的方法。
CN201810242149.9A 2018-03-22 2018-03-22 应用程序的搜索方法、装置、终端及存储介质 Active CN110196833B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810242149.9A CN110196833B (zh) 2018-03-22 2018-03-22 应用程序的搜索方法、装置、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810242149.9A CN110196833B (zh) 2018-03-22 2018-03-22 应用程序的搜索方法、装置、终端及存储介质

Publications (2)

Publication Number Publication Date
CN110196833A CN110196833A (zh) 2019-09-03
CN110196833B true CN110196833B (zh) 2023-06-09

Family

ID=67751035

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810242149.9A Active CN110196833B (zh) 2018-03-22 2018-03-22 应用程序的搜索方法、装置、终端及存储介质

Country Status (1)

Country Link
CN (1) CN110196833B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111125523B (zh) * 2019-12-20 2024-03-01 华为技术有限公司 搜索方法、装置、终端设备及存储介质
CN111209479B (zh) * 2020-01-06 2023-05-05 北京字节跳动网络技术有限公司 对象推送方法及装置
CN111310078B (zh) * 2020-02-10 2023-06-23 北京字节跳动网络技术有限公司 一种搜索结果展示策略的确定方法及装置
CN112214573A (zh) * 2020-10-30 2021-01-12 数贸科技(北京)有限公司 信息搜索系统、方法、计算设备及计算机存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021440A (zh) * 2016-05-16 2016-10-12 中国建设银行股份有限公司 一种搜索方法及装置
CN106709040A (zh) * 2016-12-29 2017-05-24 北京奇虎科技有限公司 一种应用搜索方法和服务器
CN106919588A (zh) * 2015-12-24 2017-07-04 北京奇虎科技有限公司 一种应用程序搜索系统及方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000046701A1 (en) * 1999-02-08 2000-08-10 Huntsman Ici Chemicals Llc Method for retrieving semantically distant analogies
US20090199090A1 (en) * 2007-11-23 2009-08-06 Timothy Poston Method and system for digital file flow management
CN103309903A (zh) * 2012-03-16 2013-09-18 刘龙 一种基于云计算的位置搜索系统及方法
CN104516887B (zh) * 2013-09-27 2019-08-30 腾讯科技(深圳)有限公司 一种网页数据搜索方法、装置和系统
CN103838856B (zh) * 2014-03-17 2018-12-14 联想(北京)有限公司 一种信息处理方法及装置
WO2015196964A1 (zh) * 2014-06-24 2015-12-30 北京奇虎科技有限公司 搜索匹配图片的方法、图片搜索方法及装置
CN110457577B (zh) * 2015-04-01 2023-04-14 创新先进技术有限公司 数据处理方法、装置、设备和计算机存储介质
CN105550213A (zh) * 2015-12-03 2016-05-04 小米科技有限责任公司 图片浏览方法和装置
CN106919575B (zh) * 2015-12-24 2020-12-25 北京奇虎科技有限公司 应用程序搜索方法及装置
CN106326484A (zh) * 2016-08-31 2017-01-11 北京奇艺世纪科技有限公司 搜索词纠错方法及装置
CN107818105B (zh) * 2016-09-13 2021-04-09 腾讯科技(深圳)有限公司 应用程序的推荐方法及服务器
CN106611288A (zh) * 2016-10-12 2017-05-03 四川用联信息技术有限公司 一种改进的柔性流水车间调度问题的求解算法
CN106534197A (zh) * 2016-12-22 2017-03-22 国家电网公司 一种自治域内恶意流量过滤方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106919588A (zh) * 2015-12-24 2017-07-04 北京奇虎科技有限公司 一种应用程序搜索系统及方法
CN106021440A (zh) * 2016-05-16 2016-10-12 中国建设银行股份有限公司 一种搜索方法及装置
CN106709040A (zh) * 2016-12-29 2017-05-24 北京奇虎科技有限公司 一种应用搜索方法和服务器

Also Published As

Publication number Publication date
CN110196833A (zh) 2019-09-03

Similar Documents

Publication Publication Date Title
CN110196833B (zh) 应用程序的搜索方法、装置、终端及存储介质
CN108334539B (zh) 对象推荐方法、移动终端及计算机可读存储介质
CN109918669B (zh) 实体确定方法、装置及存储介质
CN110573837B (zh) 导航方法、装置、存储介质以及服务器
CN110309405B (zh) 一种项目推荐方法、装置及存储介质
CN106294308B (zh) 命名实体识别方法及装置
CN110019840B (zh) 一种知识图谱中实体更新的方法、装置和服务器
CN110989847B (zh) 信息推荐方法、装置、终端设备及存储介质
CN107436948B (zh) 文件搜索方法、装置及终端
TW201512865A (zh) 一種網頁數據搜索方法、裝置和系統
CN108427761B (zh) 一种新闻事件处理的方法、终端、服务器及存储介质
US9843670B2 (en) Method and apparatus for setting color ring back tone and determining color ring back tone music
CN106126570B (zh) 信息服务系统
CN110633438B (zh) 一种新闻事件处理的方法、终端、服务器及存储介质
CN111078986B (zh) 数据检索方法、装置及计算机可读存储介质
CN108205568A (zh) 基于标签选择数据的方法及装置
CN109871524B (zh) 一种图表生成方法及装置
WO2014146450A1 (en) Method, device and system for data searching
CN106844572B (zh) 搜索结果处理方法及装置、用于搜索结果处理的装置
CN116070114A (zh) 数据集的构建方法、装置、电子设备及存储介质
CN108491502B (zh) 一种新闻追踪的方法、终端、服务器及存储介质
CN111666485A (zh) 一种信息推荐方法、装置及终端
CN113190752A (zh) 信息推荐方法、移动终端及存储介质
CN112925878B (zh) 数据处理方法和装置
US20220197939A1 (en) Image-based search method, server, terminal, and medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant