CN108021574A - 一种搜索方法及装置 - Google Patents

一种搜索方法及装置 Download PDF

Info

Publication number
CN108021574A
CN108021574A CN201610951653.7A CN201610951653A CN108021574A CN 108021574 A CN108021574 A CN 108021574A CN 201610951653 A CN201610951653 A CN 201610951653A CN 108021574 A CN108021574 A CN 108021574A
Authority
CN
China
Prior art keywords
user
song
class
classification
characteristic attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610951653.7A
Other languages
English (en)
Inventor
赵子天
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kuwo Technology Co Ltd
Original Assignee
Beijing Kuwo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kuwo Technology Co Ltd filed Critical Beijing Kuwo Technology Co Ltd
Priority to CN201610951653.7A priority Critical patent/CN108021574A/zh
Publication of CN108021574A publication Critical patent/CN108021574A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例涉及一种搜索方法及装置,方法包括:获取历史用户的行为日志,其中,行为日志包括用户使用习惯数据;根据所述使用习惯数据,获取历史用户特征属性;根据历史用户特征数据,利用贝叶斯分类算法对历史用户进行分类,获取用户类别集、用户类别集中每一类别用户的偏好歌曲以及所述偏好歌曲的点击率;当目标用户进行搜索时,将目标用户的使用习惯数据与用户类别集进行匹配,确定目标用户的类别,并在搜索结果中对该目标用户的类别对应的偏好歌曲按照偏好歌曲的点击率进行排序显示,针对每一类用户,通过分析用户自身的使用习惯以及歌曲偏好,提供个性化的搜索结果,使每一类用户对各自的搜索结果比较满意,提高了用户体验。

Description

一种搜索方法及装置
技术领域
本发明涉及大数据处理领域,尤其涉及一种搜索方法及装置。
背景技术
随着互联网的迅猛发展、WEB信息的增加,用户要在信息海洋里查找自己所需的信息,就象大海捞针一样。
现有技术中,用户主要基于搜索词和搜索资源的匹配程度来返回搜索结果,这样有两点不足:第一,搜索结果按照资源热度排序,不满足小众用户的搜索期望;第二,不同用户的使用习惯不同,不同状态下的用户对每日不变的搜索结果不满意。
发明内容
本发明实施例提供了一种搜索方法及装置,解决了小众用户对按照资源热度排序的结果不满意以及不同状态下的用户对每日不变的搜索结果不满意的问题。
第一方面,本发明提供了一种搜索方法,所述方法包括以下步骤:获取历史用户的行为日志,其中,所述行为日志包括用户使用习惯数据;根据所述使用习惯数据,获取历史用户特征属性;根据所述历史用户特征属性,利用贝叶斯分类算法对历史用户进行分类,获取用户类别集、所述用户类别集中每一类别用户的偏好歌曲以及所述偏好歌曲的点击率;当目标用户进行搜索时,将目标用户的使用习惯数据与所述用户类别集进行匹配,确定目标用户的类别,并在搜索结果中对该目标用户的类别对应的偏好歌曲按照偏好歌曲的点击率进行排序显示。
优选地,所述用户使用习惯具体包括:用户id,用户登录状态,歌曲id,歌曲是否听完,歌曲收听时长,下载状态,付费状态。
优选地,所述特征属性具体包括::用户活跃频次,用户活跃时段,用户日均听歌数,用户日均听歌时长,用户所听歌曲平均发行年代,用户付费记录。
优选地,所述根据所述历史用户特征属性,利用贝叶斯分类算法对历史用户进行分类,获取用户类别集、所述用户类别集中每一类别用户的偏好歌曲以及所述偏好歌曲的点击率具体包括:将用户分类为:时段敏感型用户,热点偏好用户,正版歌曲偏好用户,冷门小众偏好用户,付费偏好用户等,记为有类别集合X={x1,x2,…xm},其中,m为用户分类的个数;将历史用户特征属性记为有类别集合Y={y1,y2,…yn},其中,n为历史用户特征属性个数;计算P(y1|x),P(y2|x),P(yn|x),获取在每一个用户类别下,每一个历史用户特征属性的条件概率;根据以该公式最大值作为用户分类结果,获取的用户分类结果即为用户类别集。
优选地,所述计算P(y1|x),P(y2|x),P(yn|x),获取在每一个用户类别下,每一个历史用户特征属性的条件概率具体包括:确定已知用户类别的特征属性以及该特征属性下的特征数据,即训练样本集;统计在各用户类别下各个特征属性的条件概率估计,即P(a1|y1),P(a2|y1),…,P(am|y1);P(a1|y2),P(a2|y2),…,P(am|y2);…;P(a1|yn),P(a2|yn),…。
第二方面,本发明提供了一种搜索装置,所述装置包括:第一获取单元,第二获取单元,训练单元,分类单元;其中,所述第一获取单元,获取历史用户的行为日志,其中,所述行为日志包括用户使用习惯数据;所述第二获取单元,根据所述使用习惯数据,获取历史用户特征属性;所述训练单元,用于根据所述历史用户特征属性,利用贝叶斯分类算法对历史用户进行分类,获取用户类别集、所述用户类别集中每一类别用户的偏好歌曲以及所述偏好歌曲的点击率;所述分类单元,当目标用户进行搜索时,将目标用户的使用习惯数据与所述用户类别集进行匹配,确定目标用户的类别,并在搜索结果中对该目标用户的类别对应的偏好歌曲按照偏好歌曲的点击率进行排序显示。
优选地,所述用户使用习惯具体包括:用户id,用户登录状态,歌曲id,歌曲是否听完,歌曲收听时长,下载状态,付费状态。
优选地,所述特征属性具体包括:用户活跃频次,用户活跃时段,用户日均听歌数,用户日均听歌时长,用户所听歌曲平均发行年代,用户付费记录。
优选地,所述训练单元具体用于:将用户分类为:时段敏感型用户,热点偏好用户,正版歌曲偏好用户,冷门小众偏好用户,付费偏好用户等,记为有类别集合X={x1,x2,…xm},其中,m为用户分类的个数;将历史用户特征属性记为有类别集合Y={y1,y2,…yn},其中,n为历史用户特征属性个数;计算P(y1|x),P(y2|x),P(yn|x),获取在每一个用户类别下,每一个历史用户特征属性的条件概率;根据以该公式最大值作为用户分类结果,获取的用户分类结果即为用户类别集。
优选地,所述训练单元具体用于:确定已知用户类别的特征属性以及该特征属性下的特征数据,即训练样本集;统计在各用户类别下各个特征属性的条件概率估计,即P(a1|y1),P(a2|y1),…,P(am|y1);P(a1|y2),P(a2|y2),…,P(am|y2);…;P(a1|yn),P(a2|yn),…。
相较于现有技术,本发明实施例中,获取历史用户的行为日志,其中,行为日志包括用户使用习惯数据;根据所述使用习惯数据,获取历史用户特征属性;根据历史用户特征属性,利用贝叶斯分类算法对历史用户进行分类,获取用户类别集、用户类别集中每一类别用户的偏好歌曲以及所述偏好歌曲的点击率;当目标用户进行搜索时,将目标用户的使用习惯数据与用户类别集进行匹配,确定目标用户的类别,并在搜索结果中对该目标用户的类别对应的偏好歌曲按照偏好歌曲的点击率进行排序显示,针对每一类用户,通过分析用户自身的使用习惯以及歌曲偏好,提供个性化的搜索结果,使每一类用户对各自的搜索结果比较满意,提高了用户体验。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例。
图1为本发明实施例提供的一种搜索方法流程示意图;
图2为本发明实施例提供用户分类的示意图;
图3为本发明实施例提供的一种搜索装置结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为便于对本发明实施例的理解,下面将结合附图以具体实施例做进一步的解释说明,实施例并不构成对本发明实施例的限定。
当本发明实施例提及“第一”、“第二”等序数词时,除非根据上下文其确实表达顺序之意,应当理解为仅仅起区分的作用。
图1为本发明实施例提供的搜索方法流程示意图。如图1所示,该方法的应用场景为终端。所述终端可以称之为用户设备(User Equipment,UE)、移动台(Mobile Station,MS)、移动终端(Mobile Terminal)、计算机、微机等。例如,终端可以是移动电脑、具有移动终端的计算机,本发明对此并不限定。在本发明中,该方法的执行主体为歌曲播放软件的服务器,比如酷我音乐盒,该方法包括:
S110,获取历史用户的行为日志,其中,所述行为日志包括用户使用习惯数据。
其中,客户端记录用户行为的日志称为行为日志。行为日志内容包括用户使用习惯数据,使用习惯数据包括但不限于:用户id,用户登录状态,歌曲id,歌曲是否听完,歌曲收听时长,歌曲发行时间,下载状态,付费状态。客户端将行为日志发送给服务器,用于之后统计分析。
S120,根据使用习惯数据,获取历史用户特征属性。
根据获取到的使用习惯数据,统计特征属性,其中,特征属性包括但不限于:用户活跃频次,用户活跃时段,用户日均听歌数,用户日均听歌时长,用户所听歌曲平均发行年代,用户付费记录。
S130,根据历史用户特征属性,利用贝叶斯分类算法对历史用户进行分类,获取用户类别集、所述用户类别集中每一类别用户的偏好歌曲以及所述偏好歌曲的点击率。
首先,将用户分类为:时段敏感型用户,热点偏好用户,正版歌曲偏好用户,冷门小众偏好用户,付费偏好用户等,记为有类别集合X={x1,x2,…xm},其中,m为用户分类的个数。
其次,将历史用户特征属性,记为有类别集合Y={y1,y2,…yn},其中,n为历史用户特征属性个数。
再次,计算P(y1|x),P(y2|x),P(yn|x),获取在每一个用户类别下,每一个历史用户特征属性的概率。
在计算P(y1|x),P(y2|x),P(yn|x)时,先找到一个已知用户类别有哪些特征属性,即训练样本集;再统计得到在各用户类别下各个特征属性的条件概率估计,即P(a1|y1),P(a2|y1),…,P(am|y1);P(a1|y2),P(a2|y2),…,P(am|y2);…;P(a1|yn),P(a2|yn),…。
再次,如果P(yi|x)P(yi)=max{P(y1|x),P(y2|x),…P(yn|x)},则x∈yk。因为各个特征属性是条件独立的,根据贝叶斯定理有如下推导:
P(yk|x)=P(x|yi)P(yi)/P(x),因为分母对于所有用户类别为常数,只要将分子最大化即可。又因为各特征属性是条件独立的,所以有:
以该公式最大值作为用户分类结果,获取的用户分类结果即为用户类别集。
统计每个用户类别下的用户偏好歌曲,每个用户偏好歌曲具有相应的点击率。
S140,当目标用户进行搜索时,将目标用户的使用习惯数据与用户类别集进行匹配,确定目标用户的类别,并在搜索结果中对该目标用户的类别对应的偏好歌曲按照偏好歌曲的点击率进行排序显示。
当目标用户进行搜索时,对该目标用户的类别进行预测,确定目标用户类别,并在搜索结果中对该目标用户的类别对应的偏好歌曲按照偏好歌曲的点击率进行排序显示,即将点击率高的歌曲位置靠前,点击率低的歌曲位置靠后。
图2为本发明实施例提供用户分类的示意图。在图2中,分为准备工作阶段、分类器训练阶段和应用阶段三个阶段。
准备工作阶段,这个阶段的任务是为贝叶斯分类做必要的准备,主要工作是根据使用习惯数据确定特征属性,并对每个特征属性进行适当划分,然后由人工对一部分待分类数据进行分类,形成训练样本集。这一阶段的输入是所有待分类数据,即历史用户使用习惯数据,输出是特征属性和训练样本。这一阶段是整个朴素贝叶斯分类中唯一需要人工完成的阶段,其质量对整个过程将有重要影响,分类器的质量很大程度上由特征属性、特征属性划分及训练样本质量决定。
分类器训练阶段,这个阶段的任务就是生成分类器,主要工作是计算每个用户类别在训练样本中的出现频率及每个特征属性划分对每个用户类别的条件概率估计,并将结果记录。其输入是特征属性和训练样本,输出是分类器。这一阶段是机械性阶段,根据S130下的公式可以由程序自动计算完成。
应用阶段,这个阶段的任务是使用分类器对待分类数据进行分类,其输入是分类器和待分类数据,输出是待分类数据与用户类别的映射关系。这一阶段也是机械性阶段,由程序完成。根据这一步骤,可以实现对用户的分类,确定用户类别。
应用本发明提供的搜索方法,通过获取历史用户的行为日志,其中,行为日志包括用户使用习惯数据;根据所述使用习惯数据,获取历史用户特征属性;根据历史用户特征数据,利用贝叶斯分类算法对历史用户进行分类,获取用户类别集、用户类别集中每一类别用户的偏好歌曲以及所述偏好歌曲的点击率;当目标用户进行搜索时,将目标用户的使用习惯数据与用户类别集进行匹配,确定目标用户的类别,并在搜索结果中对该目标用户的类别对应的偏好歌曲按照偏好歌曲的点击率进行排序显示,针对每一类用户,通过分析用户自身的使用习惯以及歌曲偏好,提供个性化的搜索结果,使每一类用户对各自的搜索结果比较满意,提高了用户体验。
图3为本发明实施例提供的一种搜索装置结构图。所述装置包括:第一获取单元310,第二获取单元320,训练单元330,分类单元340。
第一获取单元310用于获取历史用户的行为日志,其中,所述行为日志包括用户使用习惯数据。
第二获取单元320用于根据所述使用习惯数据,获取历史用户特征属性。
训练单元330用于根据所述历史用户特征属性,利用贝叶斯分类算法对历史用户进行分类,获取用户类别集、所述用户类别集中每一类别用户的偏好歌曲以及所述偏好歌曲的点击率。
分类单元340,用于当目标用户进行搜索时,将目标用户的使用习惯数据与所述用户类别集进行匹配,确定目标用户的类别,并在搜索结果中对该目标用户的类别对应的偏好歌曲按照偏好歌曲的点击率进行排序显示。
其中,用户使用习惯包括但不限于:用户id,用户登录状态,歌曲id,歌曲是否听完,歌曲收听时长,下载状态,付费状态。
特征数据包括但不限于:用户活跃频次,用户活跃时段,用户日均听歌数,用户日均听歌时长,用户所听歌曲平均发行年代,用户付费记录。
训练单元330具体用于:
首先,将用户分类为:时段敏感型用户,热点偏好用户,正版歌曲偏好用户,冷门小众偏好用户,付费偏好用户等,记为有类别集合X={x1,x2,…xm},其中,m为用户分类的个数。
其次,将历史用户特征属性,记为有类别集合Y={y1,y2,…yn},其中,n为历史用户特征数据个数。
再次,计算P(y1|x),P(y2|x),P(yn|x),获取在每一个用户类别下,每一个历史用户特征属性的概率。
在计算P(y1|x),P(y2|x),P(yn|x)时,先找到一个已知用户类别有哪些特征属性,即训练样本集;再统计得到在各用户类别下各个特征属性的条件概率估计,即P(a1|y1),P(a2|y1),…,P(am|y1);P(a1|y2),P(a2|y2),…,P(am|y2);…;P(a1|yn),P(a2|yn),…。
再次,如果P(yi|x)P(yi)=max{P(y1|x),P(y2|x),…P(yn|x)},则x∈yk。因为各个特征属性是条件独立的,根据贝叶斯定理有如下推导:
P(yk|x)=P(x|yi)P(yi)/P(x),因为分母对于所有用户类别为常数,只要将分子最大化即可。又因为各特征属性是条件独立的,所以有:
以该公式最大值作为用户分类结果,获取的用户分类结果即为用户类别集。
统计每个用户类别下的用户偏好歌曲,每个用户偏好歌曲具有相应的点击率。应用本发明提供的搜索装置,第一获取单元获取历史用户的行为日志,其中,所述行为日志包括用户使用习惯数据;第二获取单元根据所述使用习惯数据,获取历史用户特征属性;训练单元根据所述历史用户特征属性,利用贝叶斯分类算法对历史用户进行分类,获取用户类别集、所述用户类别集中每一类别用户的偏好歌曲以及所述偏好歌曲的点击率;分类单元,当目标用户进行搜索时,将目标用户的使用习惯数据与所述用户类别集进行匹配,确定目标用户的类别,并在搜索结果中对该目标用户的类别对应的偏好歌曲按照偏好歌曲的点击率进行排序显示,针对每一类用户,通过分析用户自身的使用习惯以及歌曲偏好,提供个性化的搜索结果,使每一类用户对各自的搜索结果比较满意,提高了用户体验。
本领域普通技术人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的模块及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执轨道,取决于技术方案的特定应用和设计约束条件。本领域普通技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执轨道的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种搜索方法,其特征在于,所述方法包括以下步骤:
获取历史用户的行为日志,其中,所述行为日志包括用户使用习惯数据;
根据所述使用习惯数据,获取历史用户特征属性;
根据所述历史用户特征属性,利用贝叶斯分类算法对历史用户进行分类,获取用户类别集、所述用户类别集中每一类别用户的偏好歌曲以及所述偏好歌曲的点击率;
当目标用户进行搜索时,将目标用户的使用习惯数据与所述用户类别集进行匹配,确定目标用户的类别,并在搜索结果中对该目标用户的类别对应的偏好歌曲按照偏好歌曲的点击率进行排序显示。
2.根据权利要求1所述的方法,其特征在于,所述用户使用习惯具体包括:用户id,用户登录状态,歌曲id,歌曲是否听完,歌曲收听时长,下载状态,付费状态。
3.根据权利要求1所述的方法,其特征在于,所述特征属性具体包括:
用户活跃频次,用户活跃时段,用户日均听歌数,用户日均听歌时长,用户所听歌曲平均发行年代,用户付费记录。
4.根据权利要求1所述的方法,其特征在于,所述根据所述历史用户特征属性,利用贝叶斯分类算法对历史用户进行分类,获取用户类别集、所述用户类别集中每一类别用户的偏好歌曲以及所述偏好歌曲的点击率具体包括:
将用户分类为:时段敏感型用户,热点偏好用户,正版歌曲偏好用户,冷门小众偏好用户,付费偏好用户等,记为有类别集合X={x1,x2,…xm},其中,m为用户分类的个数;
将历史用户特征属性记为有类别集合Y={y1,y2,…yn},其中,n为历史用户特征属性个数;
计算P(y1|x),P(y2|x),P(yn|x),获取在每一个用户类别下,每一个历史用户特征属性的条件概率;
根据以该公式最大值作为用户分类结果,获取的用户分类结果即为用户类别集。
5.根据权利要求4所述的方法,其特征在于,所述计算P(y1|x),P(y2|x),P(yn|x),获取在每一个用户类别下,每一个历史用户特征属性的条件概率具体包括:
确定已知用户类别的特征属性以及该特征属性下的特征数据,即训练样本集;
统计在各用户类别下各个特征属性的条件概率估计,即P(a1|y1),P(a2|y1),…,P(am|y1);P(a1|y2),P(a2|y2),…,P(am|y2);…;P(a1|yn),P(a2|yn),…。
6.一种搜索装置,其特征在于,所述装置包括:第一获取单元,第二获取单元,训练单元,分类单元;
所述第一获取单元,获取历史用户的行为日志,其中,所述行为日志包括用户使用习惯数据;
所述第二获取单元,根据所述使用习惯数据,获取历史用户特征属性;
所述训练单元,用于根据所述历史用户特征属性,利用贝叶斯分类算法对历史用户进行分类,获取用户类别集、所述用户类别集中每一类别用户的偏好歌曲以及所述偏好歌曲的点击率;
所述分类单元,当目标用户进行搜索时,将目标用户的使用习惯数据与所述用户类别集进行匹配,确定目标用户的类别,并在搜索结果中对该目标用户的类别对应的偏好歌曲按照偏好歌曲的点击率进行排序显示。
7.根据权利要求6所述的装置,其特征在于,所述用户使用习惯具体包括:用户id,用户登录状态,歌曲id,歌曲是否听完,歌曲收听时长,下载状态,付费状态。
8.根据权利要求6所述的装置,其特征在于,所述特征属性具体包括:
用户活跃频次,用户活跃时段,用户日均听歌数,用户日均听歌时长,用户所听歌曲平均发行年代,用户付费记录。
9.根据权利要求6所述的装置,其特征在于,所述训练单元具体用于:
将用户分类为:时段敏感型用户,热点偏好用户,正版歌曲偏好用户,冷门小众偏好用户,付费偏好用户等,记为有类别集合X={x1,x2,…xm},其中,m为用户分类的个数;
将历史用户特征属性记为有类别集合Y={y1,y2,…yn},其中,n为历史用户特征属性个数;
计算P(y1|x),P(y2|x),P(yn|x),获取在每一个用户类别下,每一个历史用户特征属性的条件概率;
根据以该公式最大值作为用户分类结果,获取的用户分类结果即为用户类别集。
10.根据权利要求9所述的装置,其特征在于,所述训练单元具体用于:
确定已知用户类别的特征属性以及该特征属性下的特征数据,即训练样本集;
统计在各用户类别下各个特征属性的条件概率估计,即P(a1|y1),P(a2|y1),…,P(am|y1);P(a1|y2),P(a2|y2),…,P(am|y2);…;P(a1|yn),P(a2|yn),…。
CN201610951653.7A 2016-11-02 2016-11-02 一种搜索方法及装置 Pending CN108021574A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610951653.7A CN108021574A (zh) 2016-11-02 2016-11-02 一种搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610951653.7A CN108021574A (zh) 2016-11-02 2016-11-02 一种搜索方法及装置

Publications (1)

Publication Number Publication Date
CN108021574A true CN108021574A (zh) 2018-05-11

Family

ID=62069971

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610951653.7A Pending CN108021574A (zh) 2016-11-02 2016-11-02 一种搜索方法及装置

Country Status (1)

Country Link
CN (1) CN108021574A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109951512A (zh) * 2019-01-09 2019-06-28 平安科技(深圳)有限公司 用户偏好确定方法、系统、电子设备及存储介质
CN110929088A (zh) * 2019-10-25 2020-03-27 哈尔滨师范大学 一种音乐搜索系统
CN111105297A (zh) * 2019-12-30 2020-05-05 广州探途网络技术有限公司 一种信息推送方法与相关装置
CN114075742A (zh) * 2020-08-11 2022-02-22 青岛海尔滚筒洗衣机有限公司 洗衣模式的确定方法、装置及洗衣机
EP3895039A4 (en) * 2018-12-14 2022-09-28 Ali Vassigh RESULTS OF AN AUDIO SEARCH IN A MULTICONTENT SOURCE ENVIRONMENT

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102637178A (zh) * 2011-02-14 2012-08-15 北京瑞信在线系统技术有限公司 一种音乐推荐方法、装置及系统
US20130339350A1 (en) * 2012-06-18 2013-12-19 Alibaba Group Holding Limited Ranking Search Results Based on Click Through Rates
CN104679743A (zh) * 2013-11-26 2015-06-03 阿里巴巴集团控股有限公司 一种确定用户的偏好模式的方法及装置
CN104731954A (zh) * 2015-04-01 2015-06-24 天翼爱音乐文化科技有限公司 基于群透视音乐推荐方法与系统
CN105915960A (zh) * 2016-03-31 2016-08-31 广州华多网络科技有限公司 一种用户类型的确定方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102637178A (zh) * 2011-02-14 2012-08-15 北京瑞信在线系统技术有限公司 一种音乐推荐方法、装置及系统
US20130339350A1 (en) * 2012-06-18 2013-12-19 Alibaba Group Holding Limited Ranking Search Results Based on Click Through Rates
CN104679743A (zh) * 2013-11-26 2015-06-03 阿里巴巴集团控股有限公司 一种确定用户的偏好模式的方法及装置
CN104731954A (zh) * 2015-04-01 2015-06-24 天翼爱音乐文化科技有限公司 基于群透视音乐推荐方法与系统
CN105915960A (zh) * 2016-03-31 2016-08-31 广州华多网络科技有限公司 一种用户类型的确定方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
蒋良孝,李超群: "《贝叶斯网络分类器:算法与应用》", 31 December 2015 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3895039A4 (en) * 2018-12-14 2022-09-28 Ali Vassigh RESULTS OF AN AUDIO SEARCH IN A MULTICONTENT SOURCE ENVIRONMENT
US11595729B2 (en) 2018-12-14 2023-02-28 Roku, Inc. Customizing search results in a multi-content source environment
CN109951512A (zh) * 2019-01-09 2019-06-28 平安科技(深圳)有限公司 用户偏好确定方法、系统、电子设备及存储介质
CN109951512B (zh) * 2019-01-09 2022-01-28 平安科技(深圳)有限公司 用户偏好确定方法、系统、电子设备及存储介质
CN110929088A (zh) * 2019-10-25 2020-03-27 哈尔滨师范大学 一种音乐搜索系统
CN110929088B (zh) * 2019-10-25 2023-08-25 哈尔滨师范大学 一种音乐搜索系统
CN111105297A (zh) * 2019-12-30 2020-05-05 广州探途网络技术有限公司 一种信息推送方法与相关装置
CN114075742A (zh) * 2020-08-11 2022-02-22 青岛海尔滚筒洗衣机有限公司 洗衣模式的确定方法、装置及洗衣机
CN114075742B (zh) * 2020-08-11 2023-12-15 佛山海尔滚筒洗衣机有限公司 洗衣模式的确定方法、装置及洗衣机

Similar Documents

Publication Publication Date Title
US10387559B1 (en) Template-based identification of user interest
US20210141814A1 (en) Concept-level user intent profile extraction and applications
CN108021574A (zh) 一种搜索方法及装置
Parekh et al. Studying jihadists on social media: A critique of data collection methodologies
US8364627B2 (en) Method and system for generating a linear machine learning model for predicting online user input actions
Bandari et al. The pulse of news in social media: Forecasting popularity
Rakesh et al. Project recommendation using heterogeneous traits in crowdfunding
US9324112B2 (en) Ranking authors in social media systems
CN108628971A (zh) 不均衡数据集的文本分类方法、文本分类器及存储介质
CN108363821A (zh) 一种信息推送方法、装置、终端设备及存储介质
US20070038646A1 (en) Ranking blog content
WO2019076173A1 (zh) 内容推送方法、装置及计算机设备
WO2018149337A1 (zh) 一种信息投放方法、装置及服务器
CN107194430A (zh) 一种样本筛选方法及装置,电子设备
CN108416616A (zh) 投诉举报类别的排序方法和装置
CN113934941B (zh) 一种基于多维度信息的用户推荐系统及方法
Zhu et al. Feature engineering for semantic place prediction
Zhou et al. Relevance feature mapping for content-based multimedia information retrieval
WO2010096986A1 (zh) 移动搜索方法及装置
Figueiredo et al. Identifying topic relevant hashtags in Twitter streams
Schinas et al. Mgraph: multimodal event summarization in social media using topic models and graph-based ranking
CN104572733A (zh) 用户兴趣标签分类的方法及装置
Chen et al. The best answers? think twice: online detection of commercial campaigns in the CQA forums
Calumby et al. Diversity-based interactive learning meets multimodality
KR101621735B1 (ko) 추천 검색어 제공 방법 및 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180511