CN109388693A - 一种确定分区意图的方法以及相关设备 - Google Patents

一种确定分区意图的方法以及相关设备 Download PDF

Info

Publication number
CN109388693A
CN109388693A CN201811067820.7A CN201811067820A CN109388693A CN 109388693 A CN109388693 A CN 109388693A CN 201811067820 A CN201811067820 A CN 201811067820A CN 109388693 A CN109388693 A CN 109388693A
Authority
CN
China
Prior art keywords
subregion
keyword
score
direct broadcasting
broadcasting room
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811067820.7A
Other languages
English (en)
Other versions
CN109388693B (zh
Inventor
王璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Douyu Network Technology Co Ltd
Original Assignee
Wuhan Douyu Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Douyu Network Technology Co Ltd filed Critical Wuhan Douyu Network Technology Co Ltd
Priority to CN201811067820.7A priority Critical patent/CN109388693B/zh
Publication of CN109388693A publication Critical patent/CN109388693A/zh
Application granted granted Critical
Publication of CN109388693B publication Critical patent/CN109388693B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本申请实施例提供了一种确定分区意图的方法以及相关设备,用于向用户推荐直播间分区。该方法包括:获取目标用户输入的搜索文本;对所述搜索文本进行预处理以及分词得到搜索词集合;提取所述搜索词集合的关键词得到关键词集合;计算所述关键词集合中的每个关键词对直播平台中的每个直播间的点击得分,得到点击得分集合;确定所述直播平台中的直播间分区,得到直播间分区集合;根据所述点击得分集合计算所述直播间分区集合中的每个直播间分区的得分,得到直播间分区得分集合;根据所述直播间分区得分集合计算所述搜索文本对应的分区得分向量;将所述分区得分向量中大于第二预设阈值的分区得分对应的直播间分区确定为所述目标用户的分区意图。

Description

一种确定分区意图的方法以及相关设备
技术领域
本申请涉及直播领域,尤其涉及一种确定分区意图的方法以及相关设备。
背景技术
在直播平台上,搜索是一个重要的场景。用户在进行搜索时,往往代表着用户有着想看某些特定内容的意愿。因此,可以根据用户的搜索词猜测用户的真实意图,从而返回与用户的真实意图相关的内容。
用户的搜索意图一般包括主播意图以及分区意图。主播意图指的是用户希望搜索某个具体的主播,分区意图指的是用户希望搜索某个分区的相关内容。目前,主播意图一般可以通过主播词典解决,而分区意图涉及词语较广无法采用词典。
发明内容
本申请实施例提供了一种确定分区意图的方法以及相关设备,用于确定用户输入的搜索文本对应的分区意图,从而向用户推荐与用户输入的搜索文本对应的直播间分区。
本申请实施例的第一方面提供了一种确定分区意图的方法,包括:
获取目标用户输入的搜索文本;
对所述搜索文本进行预处理以及分词得到搜索词集合;
提取所述搜索词集合的关键词得到关键词集合,所述关键词集合中的关键词的重要性权重值大于第一预设阈值;
计算所述关键词集合中的每个关键词对直播平台中的每个直播间的点击得分,得到点击得分集合,所述关键词集合与所述点击得分集合具有关联关系;
确定所述直播平台中的直播间分区,得到直播间分区集合;
根据所述点击得分集合计算所述直播间分区集合中的每个直播间分区的得分,得到直播间分区得分集合,所述直播间分区得分集合与所述点击得分集合具有关联关系;
根据所述直播间分区得分集合计算所述搜索文本对应的分区得分向量,所述分区得分向量与所述关键词集合具有关联关系;
将所述分区得分向量中大于第二预设阈值的分区得分对应的直播间分区确定为所述目标用户的分区意图。
可选地,所述提取所述搜索词集合的关键词得到关键词集合包括:
通过如下公式计算所述搜索词集合的关键词的重要性权重值:
其中,v(i)为所述搜索词集合中第i个关键词的重要性权重值,n为所述搜索词集合中的总词数,ni所述搜索词集合中的第i个关键词出现的频数,Ni为所述直播平台中出现所述第i个关键词的搜索文本数,N为所述直播平台中的所有搜索文本的数量;
将所述搜索词集合的关键词的重要性权重值大于所述第一预设阈值的关键词确定为所述关键词集合。
可选地,所述计算所述关键词集合中的每个关键词对直播平台中的每个直播间的点击得分,得到点击得分集合包括:
通过如下公式计算所述关键词集合中的每个关键词对直播平台中的每个直播间的点击得分,得到点击得分集合:
Score(r,qs)=[C(r,qs)+γLastC(r,qs)]T(qs,t,t);
其中,r为所述直播平台中第r个直播间,qs为所述关键词集合中的第s个关键词,Score(r,qs)是所述关键词集合中的第s个关键词qs在所述第r个直播间的点击得分,C(r,qs)为第一预设时段内所述第s个关键词qs下点击所述第r个直播间的次数;
LastC(r,qs)为第二预设时段内所述第s个关键词qs点击所述第r个直播间的次数,所述第二预设时段为所述第s个关键词qs点击所述第r个直播间的点击行为的发生的时间据当前时刻小于时间阈值λ;
γ为所述第二预设时段内所述第s个关键词qs点击所述第r个直播间的点击行为的权重,0<γ<1;
T(qs,t,t)为时间衰减函数。
可选地,所述方法还包括:
通过如下公式计算时间衰减函数T(qs,t,t):
其中,β是时间衰减系数,所述β为0到1之间的常数,t为所述第s个关键词所述第一预设时段内初次被点击的时刻据当天的间隔天数,ct(qs)为所述第s个关键词在当天的点击次数。
可选地,所述根据所述点击得分集合计算所述直播间分区集合中的每个直播间分区的得分,得到直播间分区得分集合包括:
通过如下公式根据所述点击得分集合计算所述直播间分区集合中的每个直播间分区的得分,得到所述直播间分区得分集合:
其中,Score(r,qs)是所述关键词集合中的第s个关键词qs在所述第r个直播间的点击得分,L为所述直播平台的所有直播间分区的集合,l为所述L中的任意一个直播间分区,lr为所述直播间分区l下所有直播间集合,r为所述直播间分区l的任意一个直播间,d(l,qs)是所述关键词集合中的第s个关键词qs在所述直播间分区l上的直播间分区得分。
可选地,所述根据所述直播间分区得分集合计算所述搜索文本对应的分区得分向量包括:
通过如下公式计算所述搜索文本对应的分区得分向量:
其中,d(l,q)是所述搜索文本q在所述直播间分区l的分区得分,v(qs)为所述关键词集合中的第s个关键词qs的重要性权重值,q1,q2,...,qn为所述关键词集合。
本申请实施例第二方面提供了一种确定分区意图的装置,包括:
获取单元,用于获取目标用户输入的搜索文本;
分词单元,用于对所述搜索文本进行预处理以及分词得到搜索词集合;
提取单元,用于提取所述搜索词集合的关键词得到关键词集合,所述关键词集合中的关键词的重要性权重值大于第一预设阈值;
第一计算单元,用于计算所述关键词集合中的每个关键词对直播平台中的每个直播间的点击得分,得到点击得分集合,所述关键词集合与所述点击得分集合具有关联关系;
第一确定单元,用于确定所述直播平台中的直播间分区,得到直播间分区集合;
第二计算单元,用于根据所述点击得分集合计算所述直播间分区集合中的每个直播间分区的得分,得到直播间分区得分集合,所述直播间分区得分集合与所述点击得分集合具有关联关系;
第三计算单元,用于根据所述直播间分区得分集合计算所述搜索文本对应的分区得分向量,所述分区得分向量与所述关键词集合具有关联关系;
第二确定单元,用于将所述分区得分向量中大于第二预设阈值的分区得分对应的直播间分区确定为所述目标用户的分区意图。
可选地,所述提取单元具体用于:
通过如下公式计算所述搜索词集合的关键词的重要性权重值:
其中,v(i)为所述搜索词集合中第i个关键词的重要性权重值,n为所述搜索词集合中的总词数,ni所述搜索词集合中的第i个关键词出现的频数,Ni为所述直播平台中出现所述第i个关键词的搜索文本数,N为所述直播平台中的所有搜索文本的数量;
将所述搜索词集合的关键词的重要性权重值大于所述第一预设阈值的关键词确定为所述关键词集合。
可选地,所述第一计算单元具体用于:
通过如下公式计算所述关键词集合中的每个关键词对直播平台中的每个直播间的点击得分,得到点击得分集合:
Score(r,qs)=[C(r,qs)+γLastC(r,qs)]T(qs,t,t);
其中,r为所述直播平台中第r个直播间,qs为所述关键词集合中的第s个关键词,Score(r,qs)是所述关键词集合中的第s个关键词qs在所述第r个直播间的点击得分,C(r,qs)为第一预设时段内所述第s个关键词qs下点击所述第r个直播间的次数;
LastC(r,qs)为第二预设时段内所述第s个关键词qs点击所述第r个直播间的次数,所述第二预设时段为所述第s个关键词qs点击所述第r个直播间的点击行为的发生的时间据当前时刻小于时间阈值λ;
γ为所述第二预设时段内所述第s个关键词qs点击所述第r个直播间的点击行为的权重,0<γ<1;
T(qs,t,t)为时间衰减函数。
可选地,所述第一计算单元还具体用于:
通过如下公式计算时间衰减函数T(qs,t,t):
其中,β是时间衰减系数,所述β为0到1之间的常数,t为所述第s个关键词所述第一预设时段内初次被点击的时刻据当天的间隔天数,ct(qs)为所述第s个关键词在当天的点击次数。
可选地,所述第二计算单元具体用于:
通过如下公式根据所述点击得分集合计算所述直播间分区集合中的每个直播间分区的得分,得到所述直播间分区得分集合:
其中,Score(r,qs)是所述关键词集合中的第s个关键词qs在所述第r个直播间的点击得分,L为所述直播平台的所有直播间分区的集合,l为所述L中的任意一个直播间分区,lr为所述直播间分区l下所有直播间集合,r为所述直播间分区l的任意一个直播间,d(l,qs)是所述关键词集合中的第s个关键词qs在所述直播间分区l上的直播间分区得分。
可选地,所述第三计算单元具体用于:
通过如下公式计算所述搜索文本对应的分区得分向量:
其中,d(l,q)是所述搜索文本q在所述直播间分区l的分区得分,v(qs)为所述关键词集合中的第s个关键词qs的重要性权重值,q1,q2,...,qn为所述关键词集合。
本申请第三方面提供了一种电子设备,包括存储器、处理器,其特征在于,所述处理器用于执行存储器中存储的计算机管理类程序时实现如上述任意一项所述的确定分区意图的方法的步骤。
本申请第四方面提供了一种计算机可读存储介质,其上存储有计算机管理类程序,其特征在于:所述计算机管理类程序被处理器执行时实现如上述任意一项所述的确定分区意图的方法的步骤。
综上所述,本申请提供的实施例中,通过计算目标用户输入直播平台的搜索文本中的关键词对直播平台中的各个直播间分区的直播间分区得分,进而可以通过该直播间分区得分计算搜索文本中的所有关键词对各个直播间分区的分区得分向量,且将分区得分向量中分区得分大于第二预设阈值的分区对应的直播间分区确定为目标用户的分区意图,由此可以基于目标用户的分区意图向目标用户进行更加符合搜索文本的直播间分区推荐。
附图说明
图1为本申请实施例提供的一种确定分区意图的方法的流程示意图;
图2为本申请实施例提供的一种确定分区意图的装置的实施例示意图;
图3为本申请实施例提供的一种确定分区意图的装置的硬件结构示意图;
图4为本申请实施例提供的一种电子设备的实施例示意图;
图5为本申请实施例提供的一种计算机可读存储介质的实施例示意图。
具体实施方式
本申请实施例提供了一种确定分区意图的方法以及相关设备,用于改善现有技术中用户只能观看直播间中直播的游戏,并不能参与游戏,可以提高用户的体验。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。
下面从确定分区意图的装置的角度对确定分区意图的方法进行说明,该确定分区意图的装置可以是服务器,也可以是服务器中的服务单元,具体不限定。
请参阅图1,图1为本申请实施例提供的确定分区意图的方法的一个实施例示意图,包括:
101、获取目标用户输入的搜索文本。
本实施例中,目标用户在登录直播平台时,可以在搜索对话框中输入搜索文本,确定分区意图的装置可以获取到目标用户输入的搜索文本。
102、对搜索文本进行预处理以及分词得到搜索词集合。
本实施例中,确定分区意图的装置可以对搜索文本进行预处理,该预处理包含拼音转写、繁体字转为简体字、全角字符转为半角字符、大写字母转为小写字母等等处理,之后,将预处理后的搜索文本进行分词,得到搜索词集合,该搜索词集合中至少包括一个搜索词。
需要理解的是,此处具体不限定如何将预处理后的搜索文本进行分词的,例如可以利用分词工具进行分词,只要能将预处理后的搜索文本进行分词即可。
103、提取搜索词集合中的关键词得到关键词集合。
本实施例中,确定分区意图的装置,可以提取搜索词集合中的关键词得到关键词集合,其中该关键词集合中的关键词的重要性权重值大于第一预设阈值,例如80%。具体的:
通过如下公式计算搜索词集合的关键词的重要性权重值:
其中,v(i)为搜索词集合中第i个关键词的重要性权重值,n为搜索词集合中的总词数,ni搜索词集合中的第i个关键词出现的频数,Ni为直播平台中出现第i个关键词的搜索文本数,N为直播平台中的所有搜索文本的数量;
将搜索词集合的关键词的重要性权重值大于第一预设阈值的关键词确定为所述关键词集合。
也就是说,确定分区意图的装置,可以首先通过上述公式计算搜索词集合中的每个关键词的重要性权重值,之后,将搜索词集合中的重要性权重值大于第一预设阈值的关键词作为关键词集合。
104、计算关键词集合中的每个关键词对直播平台中的每个直播间的点击得分,得到点击得分集合。
本实施例中,确定分区意图的装置可以计算关键词集合中的每个关键词对直播平台中的每个直播间的点击得分,得到点击得分集合,其中,关键词集合与点击得分集合具有关联关系,也就是说,关键词集合中的每个关键词都与直播平台中的所有直播间存在点击得分关系。具体的,可以通过如下公式计算关键词集合中的每个关键词对直播平台中的每个直播间的点击得分,得到点击得分集合:
Score(r,qs)=[C(r,qs)+γLastC(r,qs)]T(qs,t,t);
其中,r为直播平台中第r个直播间,qs为关键词集合中的第s个关键词,Score(r,qs)是关键词集合中的第s个关键词qs在第r个直播间的点击得分,C(r,qs)为第一预设时段内第s个关键词qs下点击第r个直播间的次数,该第一预设时段例如可以是7天或者30天,也可以是根据实际情况进行设定,具体不限定;
LastC(r,qs)为第二预设时段内第s个关键词qs点击第r个直播间的次数,第二预设时段为所述第s个关键词qs点击第r个直播间的点击行为的发生的时间据当前时刻小于时间阈值λ,该第二预设时段例如可以是3天或者1天,也可以根据实际情况进行设定,具体不限定;
γ为第二预设时段内第s个关键词qs点击第r个直播间的点击行为的权重,γ为0到1之间的常数;
T(qs,t,t)为时间衰减函数,一般采用指数衰减的方式,通过如下公式计算时间衰减函数T(qs,t,t):
其中,β是时间衰减系数,β为0到1之间的常数,t为第s个关键词在第一预设时段内初次被点击的时刻据当天的间隔天数,ct(qs)为第s个关键词在当天的点击次数。
为了便于理解,下面结合具体的例子进行说明如何计算点击得分:
假设一个搜索文本分成了A,B,C,D四个词语,词语A在其中出现了1次,文本的总次数为4。词语A在所有搜索文本中出现的次数为500个,共有搜索文本500000条,因此,词语A的重要性权重值是:
再计算词语A对直播间r的点击得分L,假设通过统计得到近7天总点击次数为C(r,qs)=100,在最近1天的该词语A点击直播间r的次数为20,最近一段时间点击行为的权重为0.3,时间衰减系数计算后为0.7,那么词语A对直播间r的点击得分为:
(100+20*0.5)*0.7=77。
105、确定直播平台中的直播间分区,得到直播间分区集合。
本实施例中,可以确定直播平台中的直播间分区,得到直播间分区集合,例如直播平台中包括的游戏直播间分区,唱歌直播间分区等等直播间分区。
106、根据点击得分集合计算直播间分区集合中的每个直播间分区的得分,得到直播间分区得分集合。
本实施例中,在得到直播间分区集合之后,可以根据点击得分集合计算直播间分区集合中的每个直播间分区的得分,得到直播间分区得分集合,该直播间分区得分集合与关键词集合具有关联关系,也就是说,点击得分集合中的每个点击得分都与直播间分区集合中的所有直播间分区存在对应关系,即直播间分区得分,具体的,可以通过如下公式根据点击得分集合计算直播间分区集合中的每个直播间分区的得分,得到所述直播间分区得分集合
其中,Score(r,qs)是关键词集合中的第s个关键词qs在第r个直播间的点击得分,L为直播平台的所有直播间分区,l为L中的任意一个直播间分区,lr为直播间分区l下所有直播间集合,r为直播间分区l的任意一个直播间,d(l,qs)是关键词集合中的第s个关键词qs在直播间分区l上的直播间分区得分。
需要说明的是,通过步骤105可以得到直播间分区集合,此处具体不限定步骤105的执行顺序,只要能在步骤106之前执行即可。
107、根据直播间分区得分集合计算搜索文本对应的分区得分向量。
本实施例中,确定分区意图的装置可以根据直播间分区得分集合计算搜索文本对应的分区得分向量,其中,该分区得分向量与关键词集合具有关联关系,也就是说,关键词集合中的每个关键词都会在分区得分向量找到一个与之对应的分区得分。具体的,通过如下公式计算搜索文本对应的分区得分向量:
其中,d(l,q)是搜索文本q在直播间分区l的分区得分,v(qs)为关键词集合中的第s个关键词qs的重要性权重值,q1,q2,...,qn为关键词集合。
108、将分区得分向量中大于第二预设阈值的分区得分对应的直播间分区确定为目标用户的分区意图。
本实施例中,确定分区意图的装置在得到分区得分向量之后,可以将分区得分向量中大于第二预设阈值的分区得分对应的直播间分区确定为目标用户的分区意图。例如“王者荣耀直播间分区”与“魔兽争霸直播间分区”对应的分区得分大于第二预设阈值,则将“王者荣耀直播间分区”与“魔兽争霸直播间分区”确定为目标用户的分区意图。
需要说明的是,确定分区意图的装置还可以将分区得分向量中分区得分最高的直播间分区确定为目标用户的分区意图,具体不限定。
综上所述,本申请提供的实施例中,通过计算目标用户输入直播平台的搜索文本中的关键词对直播平台中的各个直播间分区的直播间分区得分,进而可以通过该直播间分区得分计算搜索文本中的所有关键词对各个直播间分区的分区得分向量,且将分区得分向量中分区得分大于第二预设阈值的分区对应的直播间分区确定为目标用户的分区意图,由此可以基于目标用户的分区意图向目标用户进行更加符合搜索文本的直播间分区推荐。
上面对本申请实施例中确定分区意图的方法进行了描述,下面对本申请实施例中的确定分区意图的装置进行描述。
请参阅图2,本申请实施例中确定分区意图的装置的一个实施例,包括:
获取单元201,用于获取目标用户输入的搜索文本;
分词单元202,用于对所述搜索文本进行预处理以及分词得到搜索词集合;
提取单元203,用于提取所述搜索词集合的关键词得到关键词集合,所述关键词集合中的关键词的重要性权重值大于第一预设阈值;
第一计算单元204,用于计算所述关键词集合中的每个关键词对直播平台中的每个直播间的点击得分,得到点击得分集合,所述关键词集合与所述点击得分集合具有关联关系;
第一确定单元205,用于确定所述直播平台中的直播间分区,得到直播间分区集合;
第二计算单元206,用于根据所述点击得分集合计算所述直播间分区集合中的每个直播间分区的得分,得到直播间分区得分集合,所述直播间分区得分集合与所述点击得分集合具有关联关系;
第三计算单元207,用于根据所述直播间分区得分集合计算所述搜索文本对应的分区得分向量,所述分区得分向量与所述关键词集合具有关联关系;
第二确定单元208,用于将所述分区得分向量中大于第二预设阈值的分区得分对应的直播间分区确定为所述目标用户的分区意图。
可选地,所述提取单元203具体用于:
通过如下公式计算所述搜索词集合的关键词的重要性权重值:
其中,v(i)为所述搜索词集合中第i个关键词的重要性权重值,n为所述搜索词集合中的总词数,ni所述搜索词集合中的第i个关键词出现的频数,Ni为所述直播平台中出现所述第i个关键词的搜索文本数,N为所述直播平台中的所有搜索文本的数量;
将所述搜索词集合的关键词的重要性权重值大于所述第一预设阈值的关键词确定为所述关键词集合。
可选地,所述第一计算单元204具体用于:
通过如下公式计算所述关键词集合中的每个关键词对直播平台中的每个直播间的点击得分,得到点击得分集合:
Score(r,qs)=[C(r,qs)+γLastC(r,qs)]T(qs,t,t);
其中,r为所述直播平台中第r个直播间,qs为所述关键词集合中的第s个关键词,Score(r,qs)是所述关键词集合中的第s个关键词qs在所述第r个直播间的点击得分,C(r,qs)为第一预设时段内所述第s个关键词qs下点击所述第r个直播间的次数;
LastC(r,qs)为第二预设时段内所述第s个关键词qs点击所述第r个直播间的次数,所述第二预设时段为所述第s个关键词qs点击所述第r个直播间的点击行为的发生的时间据当前时刻小于时间阈值λ;
γ为所述第二预设时段内所述第s个关键词qs点击所述第r个直播间的点击行为的权重,0<γ<1;
T(qs,t,t)为时间衰减函数。
可选地,所述第一计算单元204还具体用于:
通过如下公式计算时间衰减函数T(qs,t,t):
其中,β是时间衰减系数,所述β为0到1之间的常数,t为所述第s个关键词所述第一预设时段内初次被点击的时刻据当天的间隔天数,ct(qs)为所述第s个关键词在当天的点击次数。
可选地,所述第二计算单元206具体用于:
通过如下公式根据所述点击得分集合计算所述直播间分区集合中的每个直播间分区的得分,得到所述直播间分区得分集合:
其中,Score(r,qs)是所述关键词集合中的第s个关键词qs在所述第r个直播间的点击得分,L为所述直播平台的所有直播间分区的集合,l为所述L中的任意一个直播间分区,lr为所述直播间分区l下所有直播间集合,r为所述直播间分区l的任意一个直播间,d(l,qs)是所述关键词集合中的第s个关键词qs在所述直播间分区l上的直播间分区得分。
可选地,所述第三计算单元207具体用于:
通过如下公式计算所述搜索文本对应的分区得分向量:
其中,d(l,q)是所述搜索文本q在所述直播间分区l的分区得分,v(qs)为所述关键词集合中的第s个关键词qs的重要性权重值,q1,q2,...,qn为所述关键词集合。
综上所述,本申请提供的实施例中,通过计算目标用户输入直播平台的搜索文本中的关键词对直播平台中的各个直播间分区的直播间分区得分,进而可以通过该直播间分区得分计算搜索文本中的所有关键词对各个直播间分区的分区得分向量,且将分区得分向量中分区得分大于第二预设阈值的分区对应的直播间分区确定为目标用户的分区意图,由此可以基于目标用户的分区意图向目标用户进行更加符合搜索文本的直播间分区推荐。
上面图2从模块化功能实体的角度对本申请实施例中的确定分区意图的装置进行了描述,下面从硬件处理的角度对本申请实施例中的确定分区意图的装置进行详细描述,请参阅图3,本申请实施例中的确定分区意图的装置300一个实施例,包括:
输入装置301、输出装置302、处理器303和存储器304(其中处理器303的数量可以一个或多个,图3中以一个处理器303为例)。在本申请的一些实施例中,输入装置301、输出装置302、处理器303和存储器304可通过总线或其它方式连接,其中,图3中以通过总线连接为例。
其中,通过调用存储器304存储的操作指令,处理器303,用于执行如下步骤:
获取目标用户输入的搜索文本;
对所述搜索文本进行预处理以及分词得到搜索词集合;
提取所述搜索词集合的关键词得到关键词集合,所述关键词集合中的关键词的重要性权重值大于第一预设阈值;
计算所述关键词集合中的每个关键词对直播平台中的每个直播间的点击得分,得到点击得分集合,所述关键词集合与所述点击得分集合具有关联关系;
确定所述直播平台中的直播间分区,得到直播间分区集合;
根据所述点击得分集合计算所述直播间分区集合中的每个直播间分区的得分,得到直播间分区得分集合,所述直播间分区得分集合与所述点击得分集合具有关联关系;
根据所述直播间分区得分集合计算所述搜索文本对应的分区得分向量,所述分区得分向量与所述关键词集合具有关联关系;
将所述分区得分向量中大于第二预设阈值的分区得分对应的直播间分区确定为所述目标用户的分区意图。
在具体实施过程中,通过调用存储器304存储的操作指令,处理器303,可以实现图1对应的实施例中任一实施方式。
请参阅图4,图4为本申请实施例提供的电子设备的实施例示意图。
如图4所示,本申请实施例提供了一种电子设备,包括存储器410、处理器420及存储在存储器420上并可在处理器420上运行的计算机程序411,处理器420执行计算机程序411时实现以下步骤:
获取目标用户输入的搜索文本;
对所述搜索文本进行预处理以及分词得到搜索词集合;
提取所述搜索词集合的关键词得到关键词集合,所述关键词集合中的关键词的重要性权重值大于第一预设阈值;
计算所述关键词集合中的每个关键词对直播平台中的每个直播间的点击得分,得到点击得分集合,所述关键词集合与所述点击得分集合具有关联关系;
确定所述直播平台中的直播间分区,得到直播间分区集合;
根据所述点击得分集合计算所述直播间分区集合中的每个直播间分区的得分,得到直播间分区得分集合,所述直播间分区得分集合与所述点击得分集合具有关联关系;
根据所述直播间分区得分集合计算所述搜索文本对应的分区得分向量,所述分区得分向量与所述关键词集合具有关联关系;
将所述分区得分向量中大于第二预设阈值的分区得分对应的直播间分区确定为所述目标用户的分区意图。
在具体实施过程中,处理器420执行计算机程序411时,可以实现图1对应的实施例中任一实施方式。
由于本实施例所介绍的电子设备为实施本申请实施例中一种确定分区意图的装置所采用的设备,故而基于本申请实施例中所介绍的方法,本领域所属技术人员能够了解本实施例的电子设备的具体实施方式以及其各种变化形式,所以在此对于该电子设备如何实现本申请实施例中的方法不再详细介绍,只要本领域所属技术人员实施本申请实施例中的方法所采用的设备,都属于本申请所欲保护的范围。
请参阅图5,图5为本申请实施例提供的一种计算机可读存储介质的实施例示意图。
如图5所示,本实施例提供了一种计算机可读存储介质500,其上存储有计算机程序511,该计算机程序511被处理器执行时实现如下步骤:
获取目标用户输入的搜索文本;
对所述搜索文本进行预处理以及分词得到搜索词集合;
提取所述搜索词集合的关键词得到关键词集合,所述关键词集合中的关键词的重要性权重值大于第一预设阈值;
计算所述关键词集合中的每个关键词对直播平台中的每个直播间的点击得分,得到点击得分集合,所述关键词集合与所述点击得分集合具有关联关系;
确定所述直播平台中的直播间分区,得到直播间分区集合;
根据所述点击得分集合计算所述直播间分区集合中的每个直播间分区的得分,得到直播间分区得分集合,所述直播间分区得分集合与所述点击得分集合具有关联关系;
根据所述直播间分区得分集合计算所述搜索文本对应的分区得分向量,所述分区得分向量与所述关键词集合具有关联关系;
将所述分区得分向量中大于第二预设阈值的分区得分对应的直播间分区确定为所述目标用户的分区意图。
在具体实施过程中,该计算机程序511被处理器执行时可以实现图1对应的实施例中任一实施方式。
需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其它实施例的相关描述。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式计算机或者其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本申请实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机软件指令,当计算机软件指令在处理设备上运行时,使得处理设备执行如图1对应实施例中的风电场数字化平台设计的方法中的流程。
所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修该,或者对其中部分技术特征进行等同替换;而这些修该或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种确定分区意图的方法,其特征在于,包括:
获取目标用户输入的搜索文本;
对所述搜索文本进行预处理以及分词得到搜索词集合;
提取所述搜索词集合的关键词得到关键词集合,所述关键词集合中的关键词的重要性权重值大于第一预设阈值;
计算所述关键词集合中的每个关键词对直播平台中的每个直播间的点击得分,得到点击得分集合,所述关键词集合与所述点击得分集合具有关联关系;
确定所述直播平台中的直播间分区,得到直播间分区集合;
根据所述点击得分集合计算所述直播间分区集合中的每个直播间分区的得分,得到直播间分区得分集合,所述直播间分区得分集合与所述点击得分集合具有关联关系;
根据所述直播间分区得分集合计算所述搜索文本对应的分区得分向量,所述分区得分向量与所述关键词集合具有关联关系;
将所述分区得分向量中大于第二预设阈值的分区得分对应的直播间分区确定为所述目标用户的分区意图。
2.根据权利要求1所述的方法,其特征在于,所述提取所述搜索词集合的关键词得到关键词集合包括:
通过如下公式计算所述搜索词集合的关键词的重要性权重值:
其中,v(i)为所述搜索词集合中第i个关键词的重要性权重值,n为所述搜索词集合中的总词数,ni所述搜索词集合中的第i个关键词出现的频数,Ni为所述直播平台中出现所述第i个关键词的搜索文本数,N为所述直播平台中的所有搜索文本的数量;
将所述搜索词集合的关键词的重要性权重值大于所述第一预设阈值的关键词确定为所述关键词集合。
3.根据权利要求2所述的方法,其特征在于,所述计算所述关键词集合中的每个关键词对直播平台中的每个直播间的点击得分,得到点击得分集合包括:
通过如下公式计算所述关键词集合中的每个关键词对直播平台中的每个直播间的点击得分,得到点击得分集合:
Score(r,qs)=[C(r,qs)+γLastC(r,qs)]T(qs,t,t);
其中,r为所述直播平台中第r个直播间,qs为所述关键词集合中的第s个关键词,Score(r,qs)是所述关键词集合中的第s个关键词qs在所述第r个直播间的点击得分,C(r,qs)为第一预设时段内所述第s个关键词qs下点击所述第r个直播间的次数;
LastC(r,qs)为第二预设时段内所述第s个关键词qs点击所述第r个直播间的次数,所述第二预设时段为所述第s个关键词qs点击所述第r个直播间的点击行为的发生的时间据当前时刻小于时间阈值λ;
γ为所述第二预设时段内所述第s个关键词qs点击所述第r个直播间的点击行为的权重,0<γ<1;
T(qs,t,t)为时间衰减函数。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
通过如下公式计算时间衰减函数T(qs,t,t):
其中,β是时间衰减系数,所述β为0到1之间的常数,t为所述第s个关键词所述第一预设时段内初次被点击的时刻据当天的间隔天数,ct(qs)为所述第s个关键词在当天的点击次数。
5.根据权利要求4所述的方法,其特征在于,所述根据所述点击得分集合计算所述直播间分区集合中的每个直播间分区的得分,得到直播间分区得分集合包括:
通过如下公式根据所述点击得分集合计算所述直播间分区集合中的每个直播间分区的得分,得到所述直播间分区得分集合:
其中,Score(r,qs)是所述关键词集合中的第s个关键词qs在所述第r个直播间的点击得分,L为所述直播平台的所有直播间分区的集合,l为所述L中的任意一个直播间分区,lr为所述直播间分区l下所有直播间集合,r为所述直播间分区l的任意一个直播间,d(l,qs)是所述关键词集合中的第s个关键词qs在所述直播间分区l上的直播间分区得分。
6.根据权利要求5所述的方法,其特征在于,所述根据所述直播间分区得分集合计算所述搜索文本对应的分区得分向量包括:
通过如下公式计算所述搜索文本对应的分区得分向量:
其中,d(l,q)是所述搜索文本q在所述直播间分区l的分区得分,v(qs)为所述关键词集合中的第s个关键词qs的重要性权重值,q1,q2,...,qn为所述关键词集合。
7.一种确定分区意图的装置,其特征在于,包括:
获取单元,用于获取目标用户输入的搜索文本;
分词单元,用于对所述搜索文本进行预处理以及分词得到搜索词集合;
提取单元,用于提取所述搜索词集合的关键词得到关键词集合,所述关键词集合中的关键词的重要性权重值大于第一预设阈值;
第一计算单元,用于计算所述关键词集合中的每个关键词对直播平台中的每个直播间的点击得分,得到点击得分集合,所述关键词集合与所述点击得分集合具有关联关系;
第一确定单元,用于确定所述直播平台中的直播间分区,得到直播间分区集合;
第二计算单元,用于根据所述点击得分集合计算所述直播间分区集合中的每个直播间分区的得分,得到直播间分区得分集合,所述直播间分区得分集合与所述点击得分集合具有关联关系;
第三计算单元,用于根据所述直播间分区得分集合计算所述搜索文本对应的分区得分向量,所述分区得分向量与所述关键词集合具有关联关系;
第二确定单元,用于将所述分区得分向量中大于第二预设阈值的分区得分对应的直播间分区确定为所述目标用户的分区意图。
8.根据权利要求7所述的装置,其特征在于,所述第三计算单元具体用于:
通过如下公式计算所述搜索文本对应的分区得分向量:
其中,d(l,q)是所述搜索文本q在所述直播间分区l的分区得分,v(qs)为所述关键词集合中的第s个关键词qs的重要性权重值,q1,q2,...,qn为所述关键词集合。
9.一种电子设备,包括存储器、处理器,其特征在于,所述处理器用于执行存储器中存储的计算机管理类程序时实现如权利要求1至6中任意一项所述的确定分区意图的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机管理类程序,其特征在于:所述计算机管理类程序被处理器执行时实现如权利要求1至6中任意一项所述的确定分区意图的方法的步骤。
CN201811067820.7A 2018-09-13 2018-09-13 一种确定分区意图的方法以及相关设备 Active CN109388693B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811067820.7A CN109388693B (zh) 2018-09-13 2018-09-13 一种确定分区意图的方法以及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811067820.7A CN109388693B (zh) 2018-09-13 2018-09-13 一种确定分区意图的方法以及相关设备

Publications (2)

Publication Number Publication Date
CN109388693A true CN109388693A (zh) 2019-02-26
CN109388693B CN109388693B (zh) 2021-04-27

Family

ID=65418704

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811067820.7A Active CN109388693B (zh) 2018-09-13 2018-09-13 一种确定分区意图的方法以及相关设备

Country Status (1)

Country Link
CN (1) CN109388693B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110110252A (zh) * 2019-05-17 2019-08-09 北京市博汇科技股份有限公司 一种视听节目识别方法、装置及存储介质
CN110390104A (zh) * 2019-07-23 2019-10-29 苏州思必驰信息科技有限公司 用于语音对话平台的不规则文本转写方法及系统
CN113821723A (zh) * 2021-09-22 2021-12-21 广州博冠信息科技有限公司 搜索方法、装置及电子设备
WO2022204991A1 (zh) * 2021-03-30 2022-10-06 京东方科技集团股份有限公司 实时音视频推荐方法、装置、设备以及计算机存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609539A (zh) * 2012-02-16 2012-07-25 北京搜狗信息服务有限公司 一种搜索方法和系统
CN105005589A (zh) * 2015-06-26 2015-10-28 腾讯科技(深圳)有限公司 一种文本分类的方法和装置
CN105653738A (zh) * 2016-03-01 2016-06-08 北京百度网讯科技有限公司 基于人工智能的搜索结果播报方法和装置
CN107832287A (zh) * 2017-09-26 2018-03-23 晶赞广告(上海)有限公司 一种标签识别方法及装置、存储介质、终端
CN107885783A (zh) * 2017-10-17 2018-04-06 北京京东尚科信息技术有限公司 获取搜索词高相关分类的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609539A (zh) * 2012-02-16 2012-07-25 北京搜狗信息服务有限公司 一种搜索方法和系统
CN105005589A (zh) * 2015-06-26 2015-10-28 腾讯科技(深圳)有限公司 一种文本分类的方法和装置
CN105653738A (zh) * 2016-03-01 2016-06-08 北京百度网讯科技有限公司 基于人工智能的搜索结果播报方法和装置
CN107832287A (zh) * 2017-09-26 2018-03-23 晶赞广告(上海)有限公司 一种标签识别方法及装置、存储介质、终端
CN107885783A (zh) * 2017-10-17 2018-04-06 北京京东尚科信息技术有限公司 获取搜索词高相关分类的方法和装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110110252A (zh) * 2019-05-17 2019-08-09 北京市博汇科技股份有限公司 一种视听节目识别方法、装置及存储介质
CN110390104A (zh) * 2019-07-23 2019-10-29 苏州思必驰信息科技有限公司 用于语音对话平台的不规则文本转写方法及系统
CN110390104B (zh) * 2019-07-23 2023-05-05 思必驰科技股份有限公司 用于语音对话平台的不规则文本转写方法及系统
WO2022204991A1 (zh) * 2021-03-30 2022-10-06 京东方科技集团股份有限公司 实时音视频推荐方法、装置、设备以及计算机存储介质
CN115486089A (zh) * 2021-03-30 2022-12-16 京东方科技集团股份有限公司 实时音视频推荐方法、装置、设备以及计算机存储介质
CN113821723A (zh) * 2021-09-22 2021-12-21 广州博冠信息科技有限公司 搜索方法、装置及电子设备
CN113821723B (zh) * 2021-09-22 2024-04-12 广州博冠信息科技有限公司 搜索方法、装置及电子设备

Also Published As

Publication number Publication date
CN109388693B (zh) 2021-04-27

Similar Documents

Publication Publication Date Title
CN108108821B (zh) 模型训练方法及装置
CN109388693A (zh) 一种确定分区意图的方法以及相关设备
CN108694647B (zh) 一种商户推荐理由的挖掘方法及装置,电子设备
CN106339507B (zh) 流媒体消息推送方法和装置
CN111931062A (zh) 一种信息推荐模型的训练方法和相关装置
CN108322317B (zh) 一种账号识别关联方法及服务器
KR20180077267A (ko) 이모티콘 추천 방법 및 장치
CN106547871A (zh) 基于神经网络的搜索结果的召回方法和装置
CN104992347A (zh) 一种视频匹配广告的方法及装置
CN111597446B (zh) 基于人工智能的内容推送方法、装置、服务器和存储介质
CN109492082A (zh) 下拉词推荐方法、装置、电子设备及存储介质
CN111159563A (zh) 用户兴趣点信息的确定方法、装置、设备及存储介质
CN109379608A (zh) 一种直播间的推荐方法以及相关设备
CN112100221A (zh) 一种资讯推荐方法、装置、推荐服务器及存储介质
CN105929979A (zh) 长句输入方法和装置
KR101931624B1 (ko) 패션 분야의 트렌드 분석방법 및 이를 포함하는 저장매체
CN112765452A (zh) 搜索推荐方法、装置及电子设备
CN108614845B (zh) 基于媒体文件的行为预估方法和装置
CN117235371A (zh) 视频推荐方法、模型训练方法及装置
CN109413461A (zh) 一种直播间的推荐方法及相关设备
KR102665356B1 (ko) 모수 추출 방법 및 이를 지원하는 서버 장치
CN113688280A (zh) 一种排序方法、装置、计算机设备和存储介质
CN110535749A (zh) 对话推送方法、装置、电子设备及存储介质
CN107292750B (zh) 社交网络的信息收集方法及信息收集装置
CN106484729B (zh) 一种词汇生成、分类方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant