CN110851726B - 兴趣点选择方法、装置以及电子设备 - Google Patents

兴趣点选择方法、装置以及电子设备 Download PDF

Info

Publication number
CN110851726B
CN110851726B CN201911129033.5A CN201911129033A CN110851726B CN 110851726 B CN110851726 B CN 110851726B CN 201911129033 A CN201911129033 A CN 201911129033A CN 110851726 B CN110851726 B CN 110851726B
Authority
CN
China
Prior art keywords
target
interest
interest point
sample
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911129033.5A
Other languages
English (en)
Other versions
CN110851726A (zh
Inventor
杨甲东
芦剑锋
张伦
辜斯缪
谭显锋
白云龙
邵院华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Original Assignee
Baidu Online Network Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu Online Network Technology Beijing Co Ltd filed Critical Baidu Online Network Technology Beijing Co Ltd
Priority to CN201911129033.5A priority Critical patent/CN110851726B/zh
Priority to CN202210775405.7A priority patent/CN115168711A/zh
Publication of CN110851726A publication Critical patent/CN110851726A/zh
Application granted granted Critical
Publication of CN110851726B publication Critical patent/CN110851726B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种面向领域的兴趣点选择方法、装置以及电子设备,涉及兴趣点选择领域。具体实现方案为:从兴趣点全集中选择目标兴趣点,并确定目标领域;获取包括多个样本的样本集合,各样本包括所属领域以及目标兴趣点;利用样本集合计算目标兴趣点与目标领域之间的相关度;根据相关度,得到目标领域相关的兴趣点。提高了兴趣点选择的适用性,能够更好的针对用户的兴趣进行兴趣点选择,能够适应样本规模不断增加的场景。

Description

兴趣点选择方法、装置以及电子设备
技术领域
本申请涉及一种大数据领域,尤其涉及一种兴趣点选择领域。
背景技术
用户兴趣点选择技术是指从用户众多(数百甚至数千)的兴趣点中挑选出符合某种业务要求的兴趣点的技术。业务可以描述为一个或若干个可被明确表达的领域。目前,对用户兴趣点的采集,一般是通过捕捉用户在产品使用的过程中的交互信号完成的,这一采集过程具有非定向、不区分领域的特点。然而,在开发产品的功能时,需要采集某一特定领域的用户的兴趣点。现有的针对特定领域选择兴趣点的方法包括三种,第一种,利用非结构化数据与兴趣点逐一匹配的方式,寻找与兴趣点关联的内容。第二种,根据查询句选择相匹配的兴趣点。第三种,基于用户关注度的兴趣点选择方法。该方法的关键是利用关注度机制判别兴趣点的名称信息与对应的地址信息是否匹配。以上三种兴趣点选择的方法,不仅选择的兴趣点与特定领域之间的相关性较低,而且无法满足在大规模的样本中选择特定领域强相关的兴趣点。
发明内容
本申请实施例提供一种兴趣点选择方法、装置以及电子设备,以解决现有技术中的一个或多个技术问题。
在第一方面,本申请实施例提供了一种兴趣点选择方法,包括:…
从兴趣点全集中选择目标兴趣点,并确定目标领域;
获取包括多个样本的样本集合,各样本包括所属领域以及目标兴趣点;
利用样本集合计算目标兴趣点与目标领域之间的相关度;
根据相关度,得到目标领域相关的兴趣点。
本实施方式中,利用样本集合计算目标兴趣点和目标领域之间的相关度,并利用相关度进而得到目标领域相关的兴趣点。不需要借鉴各个目标领域的相关知识,就能够选择出与目标领域相关的兴趣点,提高了兴趣点选择的适用性。
在一种实施方式中,还包括:
遍历兴趣点全集,计算得到多个相关度;
根据多个相关度,得到目标领域相关的兴趣点集合;
将用户兴趣点集合与目标领域相关的兴趣点集合求交集,得到目标领域相关的用户兴趣点集合。
本实施方式中,将目标领域相关的兴趣点集合与用户兴趣点集合结合,进而得到目标领域相关的用户兴趣点集合。由于考虑到了用户的兴趣点集合,能够更好的针对用户的兴趣进行兴趣点选择。另外,由于各个目标兴趣点和目标领域的相关度计算过程相互独立,能够适应样本规模不断增加的场景。同时,还使得整体计算过程可以并行化,大大降低整体的计算耗时。可以应用在获取用户的画像数据,以及给用户推荐各个领域感兴趣的内容等应用场景中。
在一种实施方式中,根据多个相关度,得到目标领域相关的兴趣点集合,包括:
在多个相关度中,筛选大于相关度阈值的相关度;
筛选得到的相关度对应的目标兴趣点确定为目标领域相关的兴趣点;
将筛选得到的目标领域相关的兴趣点组成目标领域相关的兴趣点集合。
在一种实施方式中,利用样本集合计算目标兴趣点与目标领域之间的相关度,包括:
根据样本的所属领域与目标领域是同一领域的第一样本数,以及样本的所属领域与目标领域非同一领域的第二样本数的比值,得到目标兴趣点与目标领域之间的相关度。
在本实施方式中,利用样本集合将目标兴趣点和目标领域关联起来,不需要借鉴各个目标领域的相关知识,就能够选择出与目标领域相关的兴趣点。
在一种实施方式中,根据样本的所属领域与目标领域是同一领域的第一样本数,以及样本的所属领域与目标领域非同一领域的第二样本数的比值,得到目标兴趣点与目标领域之间的相关度,包括:
计算样本的所属领域与目标领域是同一领域的第一样本概率,样本的所属领域与目标领域非同一领域的第二样本概率;
根据第一样本概率与第二样本概率的比值,得到第一样本数与第二样本数的比值;
将第一样本数与第二样本数的比值作为目标兴趣点与目标领域之间的相关度。
在本实施方式中,基于概率的相关度计算方式,能够有效的提高使得目标兴趣点和目标领域之间的相关性。
第二方面,本申请实施例提供了一种兴趣点选择装置,包括:
目标确定模块,用于从兴趣点全集中选择目标兴趣点,并确定目标领域;
样本获取模块,用于获取包括多个样本的样本集合,各样本包括所属领域以及目标兴趣点;
相关度计算模块,用于利用样本集合计算目标兴趣点与目标领域之间的相关度;
领域相关模块,用于遍历兴趣点全集,计算得到多个相关度,根据多个相关度,得到目标领域相关的兴趣点集合;
兴趣点选择模块,用于根据相关度,得到目标领域相关的兴趣点。
在一种实施方式中,还包括:
兴趣点遍历模块,用于遍历兴趣点全集,计算得到多个相关度;
兴趣点集合获取模块,用于根据多个相关度,得到目标领域相关的兴趣点集合;
求交集模块,用于将用户兴趣点集合与目标领域相关的兴趣点集合求交集,得到目标领域相关的用户兴趣点集合。
在一种实施方式中,兴趣点集合获取模块包括:
相关度筛选子模块,用于在多个相关度中,筛选大于相关度阈值的相关度;
领域相关兴趣点确定子模块,用于筛选得到的相关度对应的目标兴趣点确定为目标领域相关的兴趣点;
兴趣点集合获取子模块,用于将筛选得到的目标领域相关的兴趣点组成目标领域相关的兴趣点集合。
在一种实施方式中,相关度计算模块包括:
计算子模块,用于根据样本的所属领域与目标领域是同一领域的第一样本数,以及样本的所属领域与目标领域非同一领域的第二样本数的比值,得到目标兴趣点与目标领域之间的相关度。
在一种实施方式中,计算子模块包括:
第一计算单元,用于计算样本的所属领域与目标领域是同一领域的第一样本概率,样本的所属领域与目标领域非同一领域的第二样本概率;
第二计算单元,用于根据第一样本概率与第二样本概率的比值,得到第一样本数与第二样本数的比值;
第三计算单元,用于将第一样本数与第二样本数的比值作为目标兴趣点与目标领域之间的相关度。
上述申请中的一个实施例具有如下优点或有益效果:采用了样本集合计算目标兴趣点和目标领域之间的相关度,并利用相关度进而得到目标领域相关的兴趣点集合,结合用户兴趣点集合,进而得到目标领域相关的用户兴趣点集合的技术手段。克服了现有技术中选择的兴趣点与特定领域之间的相关性较低,无法满足在大规模的样本中选择特定领域强相关的兴趣点的技术问题。达到了不需要借鉴各个领域的相关知识,就能够选择出与领域相关的兴趣点,提高了兴趣点选择的适用性。同时,能够适应样本规模不断增加的场景的技术效果。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请实施例提供的一种兴趣点选择方法的流程示意图;
图2是根据本申请实施例的一种兴趣点选择方法场景图;
图3是根据本申请实施例提供的另一种兴趣点选择方法的流程示意图;
图4是根据本申请实施例提供的另一种兴趣点选择方法的流程示意图;
图5是根据本申请实施例提供的目标兴趣点与目标领域之间的相关度计算方法流程示意图;
图6根据本申请实施例提供的一种兴趣点选择装置的结构框图;
图7根据本申请实施例提供的另一种兴趣点选择装置的结构框图;
图8根据本申请实施例提供的计算子模块的结构框图;
图9是用来实现本申请实施例的一种兴趣点选择方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
实施例一
在一种具体实施方式中,如图1所示,提供了一种兴趣点选择方法,包括:…
步骤S10:从兴趣点全集中选择目标兴趣点,并确定目标领域;
步骤S20:获取包括多个样本的样本集合,各样本包括所属领域以及目标兴趣点;
步骤S30:利用样本集合计算目标兴趣点与目标领域之间的相关度;
步骤S40:根据相关度,得到目标领域相关的兴趣点。
在一种示例中,样本可以是视频、文章、图片等用户能够浏览内容的载体。可以对用户浏览的内容进行分类,得到多个领域。例如,科技领域、体育领域、财经领域、烹饪领域、艺术领域等。兴趣点是指用户在各个领域中感兴趣的项目。例如,体育领域中的兴趣点可以包括足球、排球、跳水、艺术体操等。财经领域中的兴趣点可以包括股票、基金等。科技领域中的兴趣点可以包括载人飞船、智能机器人、智能家电、智能手机等。兴趣点全集包含了各个领域的全部兴趣点,从兴趣点全集中选择目标兴趣点,并确定目标兴趣点对应的目标领域。
获取包括多个样本的样本集合。每个样本中包括样本的所属领域和至少一个兴趣点。例如,样本“舌尖上的中国”的视频节目,对应的领域是烹饪领域,包含的兴趣点包括中餐、西餐、各种食材等。样本“华为手机发布实录”的文章,对应的领域是科技领域,包含的兴趣点可以是智能手机、5G网络等。需要指出的是,在兴趣点全集中的任意兴趣点都能够作为目标兴趣点的情况下,为了便于得到兴趣点全集中的兴趣点和目标领域之间的相关性,在选择样本集合中的样本时,各个样本至少能够包含兴趣点全集中的任意一个可以作为目标兴趣点的兴趣点。
如图2所示,本实施方式中,利用样本数据将目标领域和目标兴趣点进行关联。具体的,根据领域标签、样本数据以及兴趣点全集计算目标兴趣点和目标领域之间的相关度。可以选择贝叶斯原理,计算包含目标兴趣点的样本的所属领域是目标领域的第一概率,包含目标兴趣点的样本的所属领域不是目标领域的第二概率,第一概率和第二概率的比值,得到目标兴趣点和目标领域之间的相关度。根据相关度,得到目标领域相关的兴趣点。例如,相关度大于相关度阈值,则确定为目标领域相关的兴趣点。
本实施方式提供的兴趣点选择方法,利用样本集合计算目标兴趣点和目标领域之间的相关度,并利用相关度进而得到目标领域相关的兴趣点。不需要借鉴各个目标领域的相关知识,就能够选择出与目标领域相关的兴趣点,提高了兴趣点选择的适用性。
在一种实施方式中,如图3所示,还包括:
步骤S50:遍历兴趣点全集,计算得到多个相关度;
步骤S60:根据多个相关度,得到目标领域相关的兴趣点集合;
步骤S70:将用户兴趣点集合与目标领域相关的兴趣点集合求交集,得到目标领域相关的用户兴趣点集合。
本实施方式中,遍历兴趣点全集中的所有兴趣点作为目标兴趣点,可以利用贝叶斯原理一一计算每个目标兴趣点和目标领域之间的相关度。将计算得到的多个相关度与相关度阈值进行比较,筛选大于相关度阈值的相关度,进而得到筛选后的相关度对应的目标兴趣点,组成目标领域相关的兴趣点集合。最后,将用户兴趣点集合考虑进来,求用户兴趣点集合和目标领域相关的兴趣点集合的交集,得到目标领域相关的用户兴趣点集合。例如,在目标领域为科技领域的情况下,从兴趣点全集中选择出与目标领域相关的兴趣点可包括手机、航天、机器人、智能家电。用户的兴趣点集合包括:5G、智能音箱、手机、哲学史、烘焙。求交集之后,得到科技领域相关的用户兴趣点集合包括5G、智能音箱、手机。
本实施方式,将目标领域相关的兴趣点集合与用户兴趣点集合结合,进而得到目标领域相关的用户兴趣点集合。由于考虑到了用户的兴趣点集合,能够更好的针对用户的兴趣进行兴趣点选择。另外,由于各个目标兴趣点和目标领域的相关度计算过程相互独立,能够适应样本规模不断增加的场景。同时,还使得整体计算过程可以并行化,大大降低整体的计算耗时。可以应用在获取用户的画像数据,以及给用户推荐各个领域感兴趣的内容等应用场景中。
在一种实施方式中,如图4所示,步骤S60:
步骤S601:在多个相关度中,筛选大于相关度阈值的相关度;
步骤S602:筛选得到的相关度对应的目标兴趣点确定为目标领域相关的兴趣点;
步骤S603:将筛选得到的目标领域相关的兴趣点组成目标领域相关的兴趣点集合。
在一种实施方式中,如图4所示,步骤S30包括:
步骤S301:根据样本的所属领域与目标领域是同一领域的第一样本数,以及样本的所属领域与目标领域非同一领域的第二样本数的比值,得到目标兴趣点与目标领域之间的相关度。
在一种示例中,由于已经在兴趣点全集中选择了目标兴趣点,所以,在样本集合中,首先筛选出包含目标兴趣点的样本。在包含目标兴趣点的样本中判断每个样本的所属领域是否和目标领域相同。根据判断结果将领域相同的样本筛选出来,得到第一样本数,将领域不同的样本筛选出来,得到第二样本数。第一样本数和第二样本数的比值,就是目标兴趣点和目标领域之间的相关度。利用样本集合将目标兴趣点和目标领域关联起来,不需要借鉴各个目标领域的相关知识,就能够选择出与目标领域相关的兴趣点。
在一种实施方式中,如图5所示,步骤S301包括:
步骤S3011:计算样本的所属领域与目标领域是同一领域的第一样本概率,样本的所属领域与目标领域非同一领域的第二样本概率;
步骤S3012:根据第一样本概率与第二样本概率的比值,得到第一样本数与第二样本数的比值;
步骤S3013:将第一样本数与第二样本数的比值作为目标兴趣点与目标领域之间的相关度。
在一种示例中,全部领域对应的兴趣点可以构成兴趣点全集S:S={att1,att2,…,atti,…,attn},|S|=n。atti为全集中的某一兴趣点。每一个样本可以表示为ti:ti=(yi,xi)。其中,yi∈{0,1}表示该样本是否属于目标领域D(0表示不属于,1表示属于),xi={atti,1,atti,2,…,atti,k}是兴趣点全集的一个真子集
Figure BDA0002277757710000081
Figure BDA0002277757710000082
表示该样本所涉及到的兴趣点集合。
贝叶斯定理是关于随机事件A和B的条件概率(或边缘概率)的一则定理。可以根据贝叶斯原理计算出,当样本仅包含一个兴趣点atti时,该样本属于目标领域D的概率p(yi=1|x=atti),样本包含此兴趣点时不属于目标领域D的概率p(yi=0|x=atti)。
Figure BDA0002277757710000083
Figure BDA0002277757710000084
其中,(1)式中,样本包含兴趣点的概率p(x=atti),样本属于目标领域D的概率p(yi=1),样本属于目标领域D时包含兴趣点的概率p(x=atti|yi=1);(2)式中,样本不属于目标领域的概率p(ti=0),样本不属于目标领域D时包含兴趣点的概率p(x=atti|yi=0)。当(1)式的结果大于(2)式时,样本包含atti时属于领域D的概率大于样本包含atti时不属于领域D的概率,可以认为兴趣点atti属于领域D的概率大于不属于领域D的概率。由于(1)(2)两式的分母相同,因此在计算的过程中直接比较分子即可。即:
Figure BDA0002277757710000091
Figure BDA0002277757710000092
其中,N、N+、N-
Figure BDA0002277757710000093
分别表示全体样本数、全体样本中属于目标领域D的样本数、全体样本中不属于目标领域D的样本数、属于目标领域D的样本中包含兴趣点atti的样本数,和不属于目标领域D的样本中包含兴趣点atti的样本数。
本实施方式中,基于概率的相关度计算方式,能够有效的提高使得目标兴趣点和目标领域之间的相关性。
由上述实施方式中的分析可知,当
Figure BDA0002277757710000094
时,即相关度阈值为1,atti属于目标领域D的概率要大于atti不属于目标领域D的概率,可以认为兴趣点atti与目标领域D强正向关联。当然,相关度阈值还可以取其它值,根据实际计算进行适应性调整,均在本实施方式的保护范围内。
将全部与指定领域D强正向关联的兴趣点合并形成集合SD,即:
Figure BDA0002277757710000095
对某个用户而言,在其全部兴趣点中选取与S的公共兴趣点,即为最终结果。假设用户u的兴趣点集合为:Su={att1,att2,…,atti,…,attk},那么与领域D相关的兴趣点集合即为:
Su,D=SD∩Su
实施例二
在另一种具体实施方式中,如图6所示,提供了一种兴趣点选择装置100,包括:
目标确定模块110,用于从兴趣点全集中选择目标兴趣点,并确定目标领域;
样本获取模块120,用于获取包括多个样本的样本集合,各样本包括所属领域以及目标兴趣点;
相关度计算模块130,用于利用样本集合计算目标兴趣点与目标领域之间的相关度;
兴趣点选择模块140,用于根据相关度,得到目标领域相关的兴趣点。在一种实施方式中,如图7所示,提供了一种兴趣点选择装置200,还包括:
兴趣点遍历模块150,用于遍历兴趣点全集,计算得到多个相关度;
兴趣点集合获取模块160,用于根据多个相关度,得到目标领域相关的兴趣点集合;
求交集模块170,用于将用户兴趣点集合与目标领域相关的兴趣点集合求交集,得到目标领域相关的用户兴趣点集合。
在一种实施方式中,如图7所示,兴趣点集合获取模块160包括:
相关度筛选子模块161,用于在多个相关度中,筛选大于相关度阈值的相关度;
领域相关兴趣点确定子模块162,用于筛选得到的相关度对应的目标兴趣点确定为目标领域相关的兴趣点;
兴趣点集合获取子模块163,用于将筛选得到的目标领域相关的兴趣点组成目标领域相关的兴趣点集合。
在一种实施方式中,如图7所示,相关度计算模块130包括:
计算子模块131,用于根据样本的所属领域与目标领域是同一领域的第一样本数,以及样本的所属领域与目标领域非同一领域的第二样本数的比值,得到目标兴趣点与目标领域之间的相关度;
在一种实施方式中,如图8所示,计算子模块131包括:
第一计算单元1311,用于计算样本的所属领域与目标领域是同一领域的第一样本概率,样本的所属领域与目标领域非同一领域的第二样本概率;
第二计算单元1312,用于根据第一样本概率与第二样本概率的比值,得到第一样本数与第二样本数的比值;
第三计算单元1313,用于将第一样本数与第二样本数的比值作为目标兴趣点与目标领域之间的相关度。
本发明实施例各装置中的各模块的功能可以参见上述方法中的对应描述,在此不再赘述。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图9所示,是根据本申请实施例的一种面向领域的兴趣点选择方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图9所示,该电子设备包括:一个或多个处理器901、存储器902,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示图形用户界面(Graphical User Interface,GUI)的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图9中以一个处理器901为例。
存储器902即为本申请所提供的非瞬时计算机可读存储介质。其中,存储器存储有可由至少一个处理器执行的指令,以使至少一个处理器执行本申请所提供的一种面向领域的兴趣点选择方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的一种面向领域的兴趣点选择方法。
存储器902作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的一种面向领域的兴趣点选择方法对应的程序指令/模块(例如,附图6所示的目标确定模块110、样本获取模块120、相关度计算模块130、兴趣点选择模块140)。处理器901通过运行存储在存储器902中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的一种面向领域的兴趣点选择方法。
存储器902可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据一种面向领域的兴趣点选择方法的电子设备的使用所创建的数据等。此外,存储器902可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器902可选包括相对于处理器901远程设置的存储器,这些远程存储器可以通过网络连接至一种面向领域的兴趣点选择方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一种面向领域的兴趣点选择方法的电子设备还可以包括:输入装置903和输出装置904。处理器901、存储器902、输入装置903和输出装置904可以通过总线或者其他方式连接,图9中以通过总线连接为例。
输入装置903可接收输入的数字或字符信息,以及产生与一种面向领域的兴趣点选择方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置904可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(Liquid Cr9stal Displa9,LCD)、发光二极管(Light Emitting Diode,LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用集成电路(Application Specific Integrated Circuits,ASIC)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(programmable logic device,PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(Cathode Ra6 Tube,阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(Local Area Network,LAN)、广域网(Wide Area Network,WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,通过确定样本在包含选定的兴趣点的情况下,是否属于指定领域的概率计算,来得到兴趣点和指定领域之间的相关度。通过相关度确定选定的兴趣点是否为与指定领域相关的兴趣点。不需要借鉴各个领域的相关知识,就能够选择出与领域相关的兴趣点,提高了兴趣点选择的适用性。由于各兴趣点的相关计算过程相互独立,通过低成本的横向扩展适应样本规模不断增加的场景,而且基于概率的相关度计算方式使得最终选择的兴趣点和指定领域之间的相关性较高。…
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (6)

1.一种兴趣点选择方法,其特征在于,包括:
从兴趣点全集中选择目标兴趣点,并确定目标领域;
获取包括多个样本的样本集合,各所述样本包括所属领域以及所述目标兴趣点;
利用所述样本集合计算所述目标兴趣点与所述目标领域之间的相关度;
根据所述相关度,得到所述目标领域相关的兴趣点;
还包括:
遍历所述兴趣点全集,计算得到多个相关度;
根据所述多个相关度,得到所述目标领域相关的兴趣点集合;
将用户兴趣点集合与所述目标领域相关的兴趣点集合求交集,得到所述目标领域相关的用户兴趣点集合;
利用所述样本集合计算所述目标兴趣点与所述目标领域之间的相关度,包括:
根据所述样本的所属领域与所述目标领域是同一领域的第一样本数,以及所述样本的所属领域与所述目标领域非同一领域的第二样本数的比值,得到所述目标兴趣点与所述目标领域之间的相关度;
其中,根据所述样本的所属领域与所述目标领域是同一领域的第一样本数,以及所述样本的所属领域与所述目标领域非同一领域的第二样本数的比值,包括:
计算所述样本的所属领域与所述目标领域是同一领域的第一样本概率,所述样本的所属领域与所述目标领域非同一领域的第二样本概率;
根据所述第一样本概率与所述第二样本概率的比值,得到所述第一样本数与所述第二样本数的比值。
2.根据权利要求1所述的方法,其特征在于,根据所述多个相关度,得到所述目标领域相关的兴趣点集合,包括:
在所述多个相关度中,筛选大于相关度阈值的相关度;
筛选得到的相关度对应的目标兴趣点确定为所述目标领域相关的兴趣点;
将筛选得到的所述目标领域相关的兴趣点组成所述目标领域相关的兴趣点集合。
3.一种兴趣点选择装置,其特征在于,包括:
目标确定模块,用于从兴趣点全集中选择目标兴趣点,并确定目标领域;
样本获取模块,用于获取包括多个样本的样本集合,各所述样本包括所属领域以及所述目标兴趣点;
相关度计算模块,用于利用所述样本集合计算所述目标兴趣点与所述目标领域之间的相关度;
兴趣点选择模块,用于根据所述相关度,得到所述目标领域相关的兴趣点;
还包括:
兴趣点遍历模块,用于遍历所述兴趣点全集,计算得到多个相关度;
兴趣点集合获取模块,用于根据所述多个相关度,得到所述目标领域相关的兴趣点集合;
求交集模块,用于将用户兴趣点集合与所述目标领域相关的兴趣点集合求交集,得到所述目标领域相关的用户兴趣点集合;
所述相关度计算模块包括:
计算子模块,用于根据所述样本的所属领域与所述目标领域是同一领域的第一样本数,以及所述样本的所属领域与所述目标领域非同一领域的第二样本数的比值,得到所述目标兴趣点与所述目标领域之间的相关度;
所述计算子模块包括:
第一计算单元,用于计算所述样本的所属领域与所述目标领域是同一领域的第一样本概率,所述样本的所属领域与所述目标领域非同一领域的第二样本概率;
第二计算单元,用于根据所述第一样本概率与所述第二样本概率的比值,得到所述第一样本数与所述第二样本数的比值;
第三计算单元,用于将所述第一样本数与所述第二样本数的比值作为所述目标兴趣点与所述目标领域之间的相关度。
4.根据权利要求3所述的装置,其特征在于,所述兴趣点集合获取模块包括:
相关度筛选子模块,用于在所述多个相关度中,筛选大于相关度阈值的相关度;
领域相关兴趣点确定子模块,用于筛选得到的相关度对应的目标兴趣点确定为所述目标领域相关的兴趣点;
兴趣点集合获取子模块,用于将筛选得到的所述目标领域相关的兴趣点组成所述目标领域相关的兴趣点集合。
5.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-2中任一项所述的方法。
6.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-2中任一项所述的方法。
CN201911129033.5A 2019-11-18 2019-11-18 兴趣点选择方法、装置以及电子设备 Active CN110851726B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201911129033.5A CN110851726B (zh) 2019-11-18 2019-11-18 兴趣点选择方法、装置以及电子设备
CN202210775405.7A CN115168711A (zh) 2019-11-18 2019-11-18 兴趣点选择方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911129033.5A CN110851726B (zh) 2019-11-18 2019-11-18 兴趣点选择方法、装置以及电子设备

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202210775405.7A Division CN115168711A (zh) 2019-11-18 2019-11-18 兴趣点选择方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN110851726A CN110851726A (zh) 2020-02-28
CN110851726B true CN110851726B (zh) 2022-07-26

Family

ID=69602004

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201911129033.5A Active CN110851726B (zh) 2019-11-18 2019-11-18 兴趣点选择方法、装置以及电子设备
CN202210775405.7A Pending CN115168711A (zh) 2019-11-18 2019-11-18 兴趣点选择方法、装置、电子设备及存储介质

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202210775405.7A Pending CN115168711A (zh) 2019-11-18 2019-11-18 兴趣点选择方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (2) CN110851726B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111881240B (zh) * 2020-07-20 2023-08-11 北京百度网讯科技有限公司 兴趣点采全率预测方法、装置、设备和可读存储介质
CN112100522B (zh) * 2020-09-15 2024-06-14 北京百度网讯科技有限公司 用于检索兴趣点的方法、装置、设备及介质
CN115344790B (zh) * 2022-10-17 2022-12-27 北京高德云信科技有限公司 配送资源的采集调度方法、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104391853A (zh) * 2014-09-25 2015-03-04 深圳大学 Poi推荐方法、poi信息处理方法及服务器
CN109190130A (zh) * 2018-08-30 2019-01-11 昆明理工大学 一种基于poi相似度与翻译机器匹配推荐算法的研究方法
CN110083767A (zh) * 2019-04-28 2019-08-02 广东工业大学 一种基于元路径的兴趣点推荐方法及相关装置
CN110390054A (zh) * 2019-07-25 2019-10-29 北京百度网讯科技有限公司 兴趣点召回方法、装置、服务器和存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8340895B2 (en) * 2009-11-05 2012-12-25 Mitac International Corp. Method of performing mixed category and point of interest search and related personal navigation device
CN103744974B (zh) * 2014-01-10 2017-04-12 北京大学 局部兴趣点选取的方法及设备
CN109948068A (zh) * 2017-09-30 2019-06-28 阿里巴巴集团控股有限公司 一种兴趣点信息的推荐方法和装置
CN107644101B (zh) * 2017-09-30 2020-11-13 百度在线网络技术(北京)有限公司 信息分类方法和装置、信息分类设备及计算机可读介质
CN108280685B (zh) * 2018-01-19 2019-07-23 百度在线网络技术(北京)有限公司 信息获取方法和装置
CN108491387B (zh) * 2018-03-20 2022-04-22 百度在线网络技术(北京)有限公司 用于输出信息的方法和装置
CN108733747A (zh) * 2018-03-30 2018-11-02 斑马网络技术有限公司 基于云计算的地图检索方法及其系统
CN109740049B (zh) * 2018-12-13 2021-08-20 北京百度网讯科技有限公司 文章的生成方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104391853A (zh) * 2014-09-25 2015-03-04 深圳大学 Poi推荐方法、poi信息处理方法及服务器
CN109190130A (zh) * 2018-08-30 2019-01-11 昆明理工大学 一种基于poi相似度与翻译机器匹配推荐算法的研究方法
CN110083767A (zh) * 2019-04-28 2019-08-02 广东工业大学 一种基于元路径的兴趣点推荐方法及相关装置
CN110390054A (zh) * 2019-07-25 2019-10-29 北京百度网讯科技有限公司 兴趣点召回方法、装置、服务器和存储介质

Also Published As

Publication number Publication date
CN115168711A (zh) 2022-10-11
CN110851726A (zh) 2020-02-28

Similar Documents

Publication Publication Date Title
US11714816B2 (en) Information search method and apparatus, device and storage medium
CN110851726B (zh) 兴趣点选择方法、装置以及电子设备
US20220114218A1 (en) Session Recommendation Method, Device and Electronic Equipment
CN111143686B (zh) 资源推荐方法及装置
JP2021190086A (ja) マルチメディアリソースの推薦方法、マルチメディアリソースの推薦装置、電子機器、非一時的なコンピュータ読み取り可能な記憶媒体及びコンピュータプログラム
CN111259222B (zh) 物品推荐方法、系统、电子设备及存储介质
US20200128286A1 (en) Live streaming social interaction to trigger product search
CN113094550A (zh) 视频检索方法、装置、设备和介质
CN111506803B (zh) 内容推荐方法、装置、电子设备及存储介质
CN111246257B (zh) 视频推荐方法、装置、设备及存储介质
CN111522940B (zh) 用于处理评论信息的方法和装置
CN111368153A (zh) 搜索方法及装置
CN111460292A (zh) 模型评估方法、装置、设备和介质
CN112559901A (zh) 资源推荐的方法、装置、电子设备、存储介质及计算机程序产品
CN111027704A (zh) 量子资源估计方法、装置和电子设备
CN112819497B (zh) 转化率预测方法、装置、设备和存储介质
CN110909390B (zh) 一种任务审核方法、装置、电子设备及存储介质
CN112288483A (zh) 用于训练模型的方法和装置、用于生成信息的方法和装置
CN112100454A (zh) 搜索方法、装置、电子设备和可读存储介质
CN111309872A (zh) 搜索处理方法、装置及设备
CN111274497B (zh) 社区推荐及模型训练方法、装置、电子设备及存储介质
CN112783543B (zh) 小程序分发物料的生成方法、装置、设备及介质
CN110889020B (zh) 站点资源挖掘方法、装置以及电子设备
CN112446728B (zh) 广告召回方法、装置、设备及存储介质
CN111198971A (zh) 搜索方法、搜索装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant