CN112101436A - 实体聚类的方法、装置、设备和存储介质 - Google Patents

实体聚类的方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN112101436A
CN112101436A CN202010930071.7A CN202010930071A CN112101436A CN 112101436 A CN112101436 A CN 112101436A CN 202010930071 A CN202010930071 A CN 202010930071A CN 112101436 A CN112101436 A CN 112101436A
Authority
CN
China
Prior art keywords
entities
entity
profile
matching
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010930071.7A
Other languages
English (en)
Inventor
徐超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN202010930071.7A priority Critical patent/CN112101436A/zh
Publication of CN112101436A publication Critical patent/CN112101436A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Abstract

在此提供了一种实体聚类的方法、装置、设备和存储介质。这里描述的方法包括:获取与多个第一实体相关联的多个第一简档,第一实体提供用户可获取的至少一项对象;获取与多个第二实体相关联的多个第二简档,第二实体提供用于引导用户获取对应的第一实体所提供的对象的引导内容;以及基于多个第一简档和多个第二简档,确定至少一个匹配集合,至少一个匹配集合包括多个第一实体中的第一实体集合和多个第二实体中的第二实体集合,第一实体集合中的第一实体的第一简档与第二实体集合中的第二实体的第二简档相匹配。根据本公开的事实,可以自动地聚合提供对象的第一实体和引导用户获取对象的第二实体,从而能够促进彼此匹配的第一实体和第二实体之间的交互。

Description

实体聚类的方法、装置、设备和存储介质
技术领域
本公开的各实现方式涉及计算机领域,更具体地,涉及实体聚类的方法、装置、设备和计算机存储介质。
背景技术
随着信息技术的发展,人们在日常生活中能够接触到各种各样的推广内容。这些推广内容能够引导人们去获取相应的对象,这样的对象例如可以包括有形的商品、数字内容或者是特定的服务等。
为了提供与对象更为匹配的推广内容,一些已有的方案例如可以通过输入特定条件来筛选创建推广内容的推广方。一方面,这样的方案需要依赖于用户的输入,从而增加了用户的交互负担。此外,这样的输入可能是不全面的,导致不能执行准确的推荐。另一方面,这样的筛选也是单向的,已有的方案无法为推广方筛选或推荐适合其创建推广内容的对象提供方。因此,如何高效且准确地匹配推广方和对象提供方成为关注的焦点。
发明对象
在本公开的第一方面,提供了一种实体聚类的方法。该方法包括:获取与多个第一实体相关联的多个第一简档,第一实体提供用户可获取的至少一项对象;获取与多个第二实体相关联的多个第二简档,第二实体提供用于引导用户获取对应的第一实体所提供的对象的引导内容;以及基于多个第一简档和多个第二简档,确定至少一个匹配集合,至少一个匹配集合包括多个第一实体中的第一实体集合和多个第二实体中的第二实体集合,第一实体集合中第一实体的第一简档与第二实体集合中第二实体的第二简档相匹配。
在本公开的第二方面中,提供了一种用于实体聚类的装置。该装置包括:第一简档获取模块,被配置为获取与多个第一实体相关联的多个第一简档,第一实体提供用户可获取的至少一项对象;第二简档获取模块,被配置为获取与多个第二实体相关联的多个第二简档,第二实体提供用于引导用户获取对应的第一实体所提供的对象的引导内容;以及匹配集合确定模块,被配置为基于所述多个第一简档和所述多个第二简档,确定至少一个匹配集合,所述至少一个匹配集合包括所述多个第一实体中的第一实体集合和所述多个第二实体中的第二实体集合,所述第一实体集合中第一实体的第一简档与所述第二实体集合中第二实体的第二简档相匹配。
在本公开的第三方面,提供了一种电子设备,包括:存储器和处理器;其中存储器用于存储一条或多条计算机指令,其中一条或多条计算机指令被处理器执行以实现根据本公开的第一方面的方法。
在本公开的第四方面,提供了一种计算机可读存储介质,其上存储有一条或多条计算机指令,其中一条或多条计算机指令被处理器执行实现根据本公开的第一方面的方法。
根据本公开的各种实施例,一方面,可以自动地实现提供对象的第一实体与推广对象的第二实体之间的聚合,降低了用户交互的成本。另一方面,还可以实现第一实体与第二实体之间的更为准确的双向匹配,能够使得匹配更加符合彼此的需求,进而提高第一实体与第二实体互相选择的成功率。
附图说明
结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标注表示相同或相似的元素,其中:
图1示出了本公开的多个实施例能够在其中实现的示例环境的示意图;
图2示出了根据本公开的一些实施例的实体聚类的示例过程的流程图;
图3示出了根据本公开的一些实施例的创建群组的示例过程的流程图;
图4示出了根据本公开的一些实施例的实体聚类的装置的示意性结构框图;以及
图5示出了能够实施本公开的多个实施例的计算设备的框图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
在本公开的实施例的描述中,术语“包括”及其类似用语应当理解为开放性包含,即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
如上文所讨论的,越来越多的对象提供方通过与对象推广方合作来引导用户获取对象提供方所提供的对象。例如,一些实体店铺或者虚拟店铺可以与一些主播合作,并通过主播的直播内容来引导用户购买他们所提供的商品。
然而,为了进行商品的推广,店铺需要耗费大量的时间去从海量的主播中筛选出合适的主播。此外,主播可能也需要耗费大量的时间去有此类需求的店铺。由此,有效匹配机制的缺乏给双方带来了巨大的不便。
同样地,在在线教育这一场景中,一些教师或教育机构在在线教学的过程中可以向学生或家长推荐一些相关的课程或者教材/器材等。此时,教师或者教育机构可能需要耗费大量的时间成本去调研并选择与在线教学匹配的其他课程或者教材/器材等。另一方面,其他课程或者教材/器材的提供方也需要耗费大量的时间成本来筛选出适合为这些课程、教材或器材进行推广的教师或教育机构。
由此可见,由于对象提供方与对象推广方之间有效匹配机制的缺乏,双方在开启合作之前需要耗费大量的时间成本。此外,由于可选范围的局限性,这样的匹配也可能是不准确的,进而影响了对象推广的效力。
为了至少部分地解决上述问题以及其他潜在问题中的一个或者多个问题,本公开的示例实施例提出了一种实体聚类的方案。总体而言,根据在此描述的实施例,可以获取与多个对象提供方(下文也称为“第一实体”,例如,实体店铺、虚拟店铺、服务提供方等能够提供用户可获取的物理对象或者虚拟对象的实体)相关联的多个第一简档。第一简档例如可以用于描述对象提供方或者其所提供的对象的属性。
随后,获取与多个对象推广方(下文也称为“第二实体”,例如,主播、在线教育平台、提供在线培训的教师、视频创作者、文字内容创造者等)相关联的多个第二简档。第二实体提供用于引导用户(例如,主播的粉丝、参加培训的学生或家长、视频的观看者、文章的读者等)获取对应的第一实体所提供的对象的引导内容(例如,在线直播内容、在线课程、视频文件、在线文章等)。第二简档例如可以描述第二实体或第二实体所创建的引导内容的属性。
相应地,基于所获取的多个第一简档和多个第二简档,确定至少一个匹配集合。至少一个匹配集合包括多个第一实体中的第一实体集合和多个第二实体中的第二实体集合,并且第一实体集合中第一实体的第一简档与第二实体集合中第二实体的第二简档相匹配。
以该方式,本公开的方案可以基于与第一实体(对象提供方)和第二实体(内容推广方)相关联的简档,自动地建立第一实体与第二实体之间的双向匹配,进而降低了构建匹配所需的时间成本。另一方面,通过对于第一简档和第二简档的匹配,本公开的方案还能够提高匹配的准确性。
以下将参照附图来具体描述本公开的实施例。
图1示出了本公开的多个实施例能够在其中实现的示例环境100的示意图。在该示例环境100中,计算设备130可以接收与多个第一实体110-1至110-N(单独或统一称为第一实体110)相关联的多个第一简档120。如上文所讨论的,第一实体110是提供用户180可获取的至少一项对象170的实体,这样的实体可以包括能够提供实体的任何个体或者组织。例如,第一实体的示例可以包括销售商品的实体店铺或者虚拟店铺、提供教育服务的教师或教育平台、提供新闻订阅服务的新闻服务提供方、提供餐饮服务的饭店和提供音乐服务的音乐服务提供方等。
第一简档120可以用于表征对应的第一实体110或者第一实体所提供的对象170。在一些实现中,第一简档120可以包括与第一实体110相关联的位置数据。例如,位置数据可以是指实体店铺所在地区、城市、省份或国家等,如,北京市。或者,位置数据也可以表示关于虚拟店铺发货地的信息,如广东省。在另一示例中,位置数据也可以表示音乐服务商所提供的服务覆盖的范围,如欧洲。
备选地,第一简档120还可以包括与第一实体110相关联的评价数据。对于第一实体110为实体店铺或者虚拟店铺的示例,评价数据例如可以是指虚拟店铺在对应的平台上的店铺等级。或者,评价数据也可以是指用户对虚拟店铺的评分。在第一实体110为提供在线培训的教师或者教育机构的示例中,评价数据也可以是指参加在线培训的学生或者其家长对于该教师或者培训机构的评分。
在一些实现中,第一简档120还可以包括用于表征第一实体110提供的至少一项对象170的属性数据。在对象170为商品的示例中,属性数据可以包括店铺所销售的商品的类别,例如首饰、化妆品、食品等。或者,属性数据也可以包括店铺销售量最大的商品的类别,如,手机。在对象170为在线培训课程的示例中,属性数据也可以是指在线课程的类别,例如,英语培训或者钢琴培训等。
在另一些实现中,第一简档120还可以包括用于表征用户180在预定时间段内所获取的对象170的获取数据。在对象170为商品的示例中,获取数据可以包括实体店铺或者虚拟店铺在过去一个月的总成交额。在对象170为在线培训课程的示例中,获取数据例如可以包括在过去一年参加到该在线培训课程的学生的数目。
如图1所示,计算设备130还可以获取与多个第二实体150-1至150-M(单独或统一称为第二实体150)相关联的多个第二简档140。如上文所讨论的,第二实体150是提供用于引导用户180获取对应的第一实体110所提供的对象170的引导内容190的实体,这样的实体可以包括能够提供引导内容190的任何个体或者组织。例如,第二实体的示例可以包括直播带货的主播、在线培训的教师或教育机构、撰写餐厅评价的作者、提供音乐分享的电台节目主持人、发布视频作品的创作者等。
在一些实现中,引导内容190可以表示为不同的形式。例如,引导内容190可以包括语音内容,例如广播节目。或者,引导内容190还可以包括文字内容,例如测评文章。此外,引导内容190还可以包括图像内容,例如图片类型的广告。又例如,引导内容190也可以包括视频内容,例如第二实体150创作的短视频,或者直播视频等。
第二简档140可以用于表征对应的第二实体150或者第二实体所提供的引导内容190。在一些实现中,第二简档140可以包括与第二实体150相关联的评价数据。对于第二实体150为主播的示例,评价数据例如可以是指主播在直播平台上的等级,越高的等级可以指示该主播具有越大的影响力。在第二实体150为提供在线培训的教师或者教育机构的示例中,评价数据也可以是指参加在线培训的学生或者其家长对于该教师或者培训机构的评分。
备选地,第二简档140也可以包括第二实体150提供的引导内容190的属性数据。在引导内容190为在线直播的示例中,属性数据可以是指直播所属的板块,例如,电子设备、美妆板块等。在引导内容190为在线培训课程的示例中,属性数据也可以是指在线课程的类别,例如,英语培训或者钢琴培训等。
在一些实现中,第二简档140还可以包括用于表征引导内容190的流行程度的流行度数据。在引导内容190为在线直播的示例中,流行度数据可以表示主播的粉丝数,或者观看主播的用户的数目。在引导内容190为在线培训课程的示例中,流行度数据可以是参加该在线培训课程的学生的数目。
在又一些实现中,第二简档140还可以包括用于表征第二实体150创建引导内容190的频率的活跃度数据。在引导内容190为在线直播的示例中,活跃度数据可以表示主播进行直播的频率,例如一天一次。在引导内容190为在线培训课程的示例中,活跃度数据可以表示教师提供该在线课程的频率,例如一周三节。
在另一些实现中,第二简档140还可以包括与经引导内容190所引导的用户180相关联的引导数据。在引导内容190为在线直播的示例中,引导数据可以包括在过去预定时间段(例如,过去一个月)内经由通过观看直播而直接购买直播带货商品的用户的数目、商品的数目或者销售总额。在引导内容190为在线培训课程的示例中,引导数据可以通过当前在线培训课程而购买了所推荐的另一在线培训课程的学生的数目、总购买时长或购买金额等。
以上描述了第一简档120和第二简档140的各种示例。应当理解,计算设备130可以通过适当地方式来获取第一简档120和第二简档140。
示例性地,计算设备130可以从虚拟店铺所在的销售平台获取第一简档120。或者,计算设备130例如还可以直接从实体店铺接收第一简档120,例如,实体店铺可以在每天结束运营后向计算设备130上传更新后的第一简档120。
类似地,计算设备130例如也可以从主播所在的直播平台来获取与主播相关联的第二简档。或者,计算设备130可以从在线教育平台获取与在线教师相关联的第二简档。
对于第二简档中可以包括的引导数据而言,以直播为例,直播平台例如可以直接记载经由直播所购买的商品的数目、金额或用户数目。相反,对于引导内容为文字或者音频的示例中,平台可能无法直接地统计文字引导内容或者音频引导内容所对应的引导数据。在一些实现中,第二实体可以在文字引导内容或者音频引导内容中提供独特的获取入口以指示用户是经由该引导内容来获取的对象170。例如,第二实体150可以在文字引导内容(例如,评测文章)中嵌入特定的获取途径,例如,特定的链接地址。或者,第二实体150可以在音频引导内容(例如,广播内容)中添加特定的获取途径(例如,独特的电话号码)。通过这样的方式,平台可以有效地统计引导数据。
如图1所示,计算设备130可以根据多个第一简档120和多个第二简档140来确定至少一个匹配集合160-1至160-O(单独或统一称为匹配集合160)。匹配集合160可以包括具有相匹配的第一简档和第二简档的第一实体110和第二实体150。例如,匹配集合160-1中包括第一实体110-1和110-2以及第二实体150。
应当理解,图1中所示的第一实体和第二实体的数目和具体的匹配集合仅是示意性地,不旨在构成对本公开的限制。
以下将结合图2来详细描述计算设备130确定至少一个匹配集合的过程。图2示出了根据本公开的一些实施例的实体聚类的示例过程200的流程图。该过程200例如可以在图1的计算设备130处实施。
在框202,计算设备130获取与多个第一实体110相关联的多个第一简档120,其中第一实体110提供用户180可获取的至少一项对象170。
如参考图1所讨论的,计算设备130可以获取用于表征对应的第一实体110或者第一实体所提供的对象170的第一简档120。在一些实现中,以销售平台上的虚拟店铺作为示例,多个第一实体110可以是指在销售平台上具有推广需求的多个虚拟店铺,计算设备130可以从销售平台获取与这些店铺相关联的第一简档。
在框204,计算设备130获取与多个第二实体150相关联的多个第二简档140,其中第二实体150提供用于引导用户180获取对应的第一实体110所提供的对象170的引导内容190。
如参考图1所讨论的,计算设备130可以获取用于表征对应的第二实体150或者第二实体150所提供的引导内容190的第二简档140。在一些实现中,以直播平台上的主播作为示例,多个第二实体150可以是指在直播平台上具有能够通过直播推广商品的多个主播,计算设备130可以从直播平台获取与这些主播相关联的第二简档。
在框206,计算设备130基于多个第一简档120和多个第二简档140来确定至少一个匹配集合160。至少一个匹配集合160包括多个第一实体中的第一实体集合和多个第二实体中的第二实体集合,并且第一实体集合中第一实体的第一简档与第二实体集合中第二实体的第二简档相匹配。
在一些实现中,计算设备130可以基于预设的匹配约束来确定至少一个匹配集合。具体地,计算设备130可以首先获取至少一项匹配约束,其中至少一项匹配约束至少包括与至少一个匹配集合相对应的第一简档约束和第二简档约束。
在一些实现中,第一简档约束可以包括关于第一简档110中所包括的位置数据、评价数据、属性数据或获取数据中的一项或多项的约束。以店铺的场景作为示例,第一简档约束的示例例如可以表示为:{发货地:北京;店铺等级:>4星;主营类目:手机;过去一月销售量:>1000},其表示店铺需要同时满足发货地、店铺等级、主营类目和销售量的约束。备选地,第一简档约束的示例可以表示为{店铺等级:>4星}或{过去一月销售量:>1000},也即店铺只用满足店铺等级或者过去一月销售量其中一项约束。
类似地,第二简档约束可以包括关于第二简档140中所包括的评价数据、属性数据、流行度数据、活跃度数据或引导数据中的一项或多项的约束。以主播的场景作为示例,第二简档约束的示例例如可以表示为{主播等级:>5;粉丝数目:>10万;板块:数码产品;直播频率:不小于一周三次;过去30天引导用户购买数:1000},其表示主播需要同时满足主播等级、粉丝数目、板块、直播频率和过去30天引导用户购买数的约束。类似地,第二简档约束也可以表示满足任一条件而不是全部条件。例如,第二简档约束的示例可以表示为{主播等级:>5}或{直播频率:不小于一周三次},也即被选择的主播满足主播等级和直播频率中的一项约束就可以。
在一些实现中,匹配约束是可配置的。例如,管理人员可以根据实际的需要来动态地调整这些匹配约束。在一些实现中,匹配约束例如还可以根据所确定的匹配集合160中第一实体与第二实体是否进行合作而被自动地调整。
示例性地,计算设备130可以基于后续合作的情况来动态地调整匹配约束。例如,当计算设备130例如确定匹配集合中的店铺往往只与粉丝数目大于30万的主播进行合作,而一些粉丝数目在10万到30万之间的主播在长时间内未能成功达成合作时,计算设备130例如可以调整第二简档约束条件中关于“粉丝数目”的约束,以使得所构建的匹配集合更加精准。
在一些实现中,在获取匹配约束后,计算设备130可以从多个第一实体110中确定第一简档满足第一简档约束的第一实体集合,并从多个第二实体中确定第二简档满足第二简档约束的第二实体集合。
示例性地,计算设备130例如可以确定多个第一实体110中的第一实体110-1和110-2以及多个第二实体150中的第二实体150-1满足与匹配集合160-1所对应的匹配约束。相应地,计算设备130可以将第一实体110-1、110-2和第二实体150-1包括在匹配集合160-1中,以指示第一实体110-1和110-2与第二实体150-1具有匹配的简档。
在一些实现中,计算设备130例如可以向第一实体110-1推荐对应的第二实体150-1,以指示第二实体150-1适合为其推广对象。相应地,计算设备130例如也可以向第二实体150-1推荐第一实体110-1和第一实体110-2,以指示第一实体110-1和第一实体110-2具有匹配的推广需求。
通过以上方式,本公开的实施例可以自动地实现提供对象的第一实体与推广对象的第二实体之间的聚合,降低了用户交互的成本。另一方面,本公开的实施例还可以实现第一实体与第二实体之间的更为准确的双向匹配,能够使得所推荐的匹配更加符合彼此的需求,进而提高第一实体与第二实体互相选择的成功率。
在一些实现中,计算设备130还可以通过构建群组来促进匹配集合中第一实体与第二实体的交互。图3示出了根据本公开一些实施例的创建群组的示例过程300的流程图。
如图3所示,在框302,计算设备130可以获取与第一实体集合相对应的第一组身份标识。示例性地,以图1中的匹配集合160-1作为示例,计算设备130可以获取与第一实体110-1和110-2的及时通信账户。
在框304,计算设备130可以获取与第二实体集合相对应的第二组身份标识。示例性地,以图1中的匹配集合160-1作为示例,计算设备130可以获取与第二实体150-1所对应的及时通信账户。
在框306,计算设备130可以基于第一组身份标识和第二组身份标识,使得第一实体集合和第二实体集合被添加到与至少一个匹配集合对应的群组。在一些实现中,群组例如可以是社交群组或者及时通信群组。
在一些实现中,计算设备130例如可以通过调用及时通信应用所提供的接口,并根据所获取的及时通信账户来将第一实体110-1和110-2以及第二实体150-1添加到同一个群组中。基于这样的方式,本公开的实施例还能够为匹配的第一实体和第二实体提供交互的平台,进一步促成后续合作的可能性。
在一些实现中,计算设备130还可以确定至少一个匹配集合中的目标实体是否已经在基于在先的匹配集合所创建的另一群组中。例如,如果计算设备130确定第一实体110-1先前已经存在于在先群组中,计算设备130可以将第一实体110-1从在先群组中移除。
备选地,计算设备130例如还可以定期地确定群组中的第一实体的第一简档或者第二实体的第二简档是否满足与匹配群组对应的匹配约束。计算设备130例如当确定某些实体因为简档发生更新而不再满足匹配约束时,计算设备130可以自动地将该实体从群组中移除。通过这样的方式,本公开的实施例可以进一步地避免一些无效的匹配,从而进一步提高匹配的有效性。
在一些实现中,为了进一步促进群组中第一实体与第二实体之间的交互,计算设备130还可以例如在群组中设置聊天机器人。在一些实现中,聊天机器人例如可以通过在群组中发布一些对话来引导第一实体与第二实体之间的交互。或者,聊天机器人例如还可以在群组中提供活动内容,该活动内容能够引导第一实体集合中的第一实体与第二实体集合中的第二实体之间的交互。对于店铺与主播的示例,活动内容例如可以是供第一实体和第二实体参与的一些线上/线下活动或者小游戏。通过这样的方式,本公开的实施例促进第一实体与第二实体的交互,提高第一实体与第二实体开展合作的概率。
在一些实现中,计算设备130还可以检测多个第一简档120或者多个第二简档140的更新。示例性地,计算设备130可以定期地获取多个第一简档120和多个第二简档140,以确定多个第一简档120和多个第二简档140是否被更新。如果计算设备130确定多个第一简档120中的第一简档被更新或多个第二简档140中的第二简档被更新,则可以根据如过程200所述的步骤来重新确定至少一个匹配集合。基于这样的方式,本公开的实施例还可以保证第一实体和第二实体总是位于适当的匹配群组中,进而提高匹配的准确性。
本公开的实施例还提供了用于实现上述方法或过程的相应装置。图4示出了根据本公开的一些实施例的实体聚类的装置400的示意性结构框图。
如图4所示,装置400可以包括第一简档获取模块410,被配置为获取与多个第一实体相关联的多个第一简档,其中第一实体提供用户可获取的至少一项对象。此外,装置400还可以包括第二简档获取模块420,被配置为获取与多个第二实体相关联的多个第二简档,第二实体提供用于引导用户获取对应的第一实体所提供的对象的引导内容。另外,装置400还可以包括匹配集合确定模块430,被配置为基于多个第一简档和多个第二简档,确定至少一个匹配集合,至少一个匹配集合包括多个第一实体中的第一实体集合和多个第二实体中的第二实体集合,第一实体集合中第一实体的第一简档与第二实体集合中第二实体的第二简档相匹配。
在一些实现中,装置400还包括:第一标识获取模块,被配置为获取与第一实体集合相对应的第一组身份标识;第二标识获取模块,被配置为获取与第二实体集合相对应的第二组身份标识;以及实体添加模块,被配置为基于第一组身份标识和第二组身份标识,使得第一实体集合和第二实体集合被添加到与至少一个匹配集合对应的群组。
在一些实现中,群组为第一群组,装置400还包括:移除模块,被配置为如果至少一个匹配集合中的目标实体已经存在于与第一群组不同的第二群组中,使得目标实体从第二群组中被移除,其中第二群组是基于在先的匹配集合所创建的。
在一些实现中,装置400还包括:提供模块,被配置为在群组中提供活动内容,活动内容引导第一实体集合中的第一实体与第二实体集合中的第二实体之间的交互。
在一些实现中,其中第一简档包括以下中的至少一项:与第一实体相关联的位置数据;与第一实体相关联的评价数据;用于表征第一实体提供的至少一项对象的属性数据;或用于表征用户在预定时间段内所获取的对象的获取数据。
在一些实现中,其中第二简档包括以下中的至少一项:与第二实体相关联的评价数据;第二实体提供的引导内容的属性数据;用于表征引导内容的流行程度的流行度数据;用于表征第二实体创建引导内容的频率的活跃度数据;或与经引导内容所引导的用户相关联的引导数据。
在一些实现中,匹配集合确定模块430包括:匹配约束获取模块,被配置为获取至少一项匹配约束,至少一项匹配约束至少包括与至少一个匹配集合相对应的第一简档约束和第二简档约束;第一集合确定模块,被配置为从多个第一实体中确定第一实体集合,第一实体集合中第一实体的第一简档满足第一简档约束;以及第二集合确定模块,被配置为从多个第二实体中确定第二实体集合,第二实体集合中第二实体的第二简档满足第二简档约束。
在一些实现中,装置400还包括:更新模块,被配置为如果多个第一简档中的第一简档被更新或多个第二简档中的第二简档被更新,重新确定至少一个匹配集合。
在一些实现中,引导内容包括以下中的至少一项:语音内容;文字内容;图像内容;或视频内容。
装置400中所包括的单元可以利用各种方式来实现,包括软件、硬件、固件或其任意组合。在一些实施例中,一个或多个单元可以使用软件和/或固件来实现,例如存储在存储介质上的机器可执行指令。除了机器可执行指令之外或者作为替代,装置400中的部分或者全部单元可以至少部分地由一个或多个硬件逻辑组件来实现。作为示例而非限制,可以使用的示范类型的硬件逻辑组件包括现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准品(ASSP)、片上系统(SOC)、复杂可编程逻辑器件(CPLD),等等。
图5示出了其中可以实施本公开的一个或多个实施例的计算设备/服务器500的框图。应当理解,图5所示出的计算设备/服务器500仅仅是示例性的,而不应当构成对本文所描述的实施例的功能和范围的任何限制。
如图5所示,计算设备/服务器500是通用计算设备的形式。计算设备/服务器500的组件可以包括但不限于一个或多个处理器或处理单元510、存储器520、存储设备530、一个或多个通信单元540、一个或多个输入设备550以及一个或多个输出设备560。处理单元510可以是实际或虚拟处理器并且能够根据存储器520中存储的程序来执行各种处理。在多处理器系统中,多个处理单元并行执行计算机可执行指令,以提高计算设备/服务器500的并行处理能力。
计算设备/服务器500通常包括多个计算机存储介质。这样的介质可以是计算设备/服务器500可访问的任何可以获得的介质,包括但不限于易失性和非易失性介质、可拆卸和不可拆卸介质。存储器520可以是易失性存储器(例如寄存器、高速缓存、随机访问存储器(RAM))、非易失性存储器(例如,只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、闪存)或它们的某种组合。存储设备530可以是可拆卸或不可拆卸的介质,并且可以包括机器可读介质,诸如闪存驱动、磁盘或者任何其他介质,其可以能够用于存储信息和/或数据(例如用于训练的训练数据)并且可以在计算设备/服务器500内被访问。
计算设备/服务器500可以进一步包括另外的可拆卸/不可拆卸、易失性/非易失性存储介质。尽管未在图5中示出,可以提供用于从可拆卸、非易失性磁盘(例如“软盘”)进行读取或写入的磁盘驱动和用于从可拆卸、非易失性光盘进行读取或写入的光盘驱动。在这些情况中,每个驱动可以由一个或多个数据介质接口被连接至总线(未示出)。存储器520可以包括计算机程序产品525,其具有一个或多个程序模块,这些程序模块被配置为执行本公开的各种实施例的各种方法或动作。
通信单元540实现通过通信介质与其他计算设备进行通信。附加地,计算设备/服务器500的组件的功能可以以单个计算集群或多个计算机器来实现,这些计算机器能够通过通信连接进行通信。因此,计算设备/服务器500可以使用与一个或多个其他服务器、网络个人计算机(PC)或者另一个网络节点的逻辑连接来在联网环境中进行操作。
输入设备550可以是一个或多个输入设备,例如鼠标、键盘、追踪球等。输出设备560可以是一个或多个输出设备,例如显示器、扬声器、打印机等。计算设备/服务器500还可以根据需要通过通信单元540与一个或多个外部设备(未示出)进行通信,外部设备诸如存储设备、显示设备等,与一个或多个使得用户与计算设备/服务器500交互的设备进行通信,或者与使得计算设备/服务器500与一个或多个其他计算设备通信的任何设备(例如,网卡、调制解调器等)进行通信。这样的通信可以经由输入/输出(I/O)接口(未示出)来执行。
根据本公开的示例性实现方式,提供了一种计算机可读存储介质,其上存储有一条或多条计算机指令,其中一条或多条计算机指令被处理器执行以实现上文描述的方法。
这里参照根据本公开实现的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其他可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其他可编程数据处理装置、或其他设备上,使得在计算机、其他可编程数据处理装置或其他设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其他可编程数据处理装置、或其他设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实现的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实现,上述说明是示例性的,并非穷尽性的,并且也不限于所公开的各实现。在不偏离所说明的各实现的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实现的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文公开的各实现。

Claims (20)

1.一种实体聚类的方法,包括:
获取与多个第一实体相关联的多个第一简档,第一实体提供用户可获取的至少一项对象;
获取与多个第二实体相关联的多个第二简档,第二实体提供用于引导用户获取对应的第一实体所提供的对象的引导内容;以及
基于所述多个第一简档和所述多个第二简档,确定至少一个匹配集合,所述至少一个匹配集合包括所述多个第一实体中的第一实体集合和所述多个第二实体中的第二实体集合,所述第一实体集合中第一实体的第一简档与所述第二实体集合中第二实体的第二简档相匹配。
2.根据权利要求1所述的方法,还包括:
获取与所述第一实体集合相对应的第一组身份标识;
获取与所述第二实体集合相对应的第二组身份标识;以及
基于所述第一组身份标识和所述第二组身份标识,使得所述第一实体集合和所述第二实体集合被添加到与所述至少一个匹配集合对应的群组。
3.根据权利要求2所述的方法,其中所述群组为第一群组,所述方法还包括:
如果所述至少一个匹配集合中的目标实体已经存在于与所述第一群组不同的第二群组中,使得所述目标实体从所述第二群组中被移除,其中所述第二群组是基于在先的匹配集合所创建的。
4.根据权利要求2所述的方法,还包括:
在所述群组中提供活动内容,所述活动内容引导所述第一实体集合中的第一实体与所述第二实体集合中的第二实体之间的交互。
5.根据权利要求1所述的方法,其中第一简档包括以下中的至少一项:
与第一实体相关联的位置数据;
与所述第一实体相关联的评价数据;
用于表征所述第一实体提供的所述至少一项对象的属性数据;或
用于表征用户在预定时间段内所获取的对象的获取数据。
6.根据权利要求1所述的方法,其中第二简档包括以下中的至少一项:
与第二实体相关联的评价数据;
所述第二实体提供的引导内容的属性数据;
用于表征所述引导内容的流行程度的流行度数据;
用于表征所述第二实体创建引导内容的频率的活跃度数据;或
与经所述引导内容所引导的用户相关联的引导数据。
7.根据权利要求1所述的方法,其中确定至少一个匹配集合包括:
获取至少一项匹配约束,所述至少一项匹配约束至少包括与所述至少一个匹配集合相对应的第一简档约束和第二简档约束;
从所述多个第一实体中确定所述第一实体集合,所述第一实体集合中第一实体的第一简档满足所述第一简档约束;以及
从所述多个第二实体中确定所述第二实体集合,所述第二实体集合中第二实体的第二简档满足所述第二简档约束。
8.根据权利要求1所述的方法,还包括:
如果所述多个第一简档中的第一简档被更新或所述多个第二简档中的第二简档被更新,重新确定所述至少一个匹配集合。
9.根据权利要求1所述的方法,其中引导内容包括以下中的至少一项:
语音内容;
文字内容;
图像内容;或
视频内容。
10.一种用于实体聚类的装置,包括:
第一简档获取模块,被配置为获取与多个第一实体相关联的多个第一简档,第一实体提供用户可获取的至少一项对象;
第二简档获取模块,被配置为获取与多个第二实体相关联的多个第二简档,第二实体提供用于引导用户获取对应的第一实体所提供的对象的引导内容;以及
匹配集合确定模块,被配置为基于所述多个第一简档和所述多个第二简档,确定至少一个匹配集合,所述至少一个匹配集合包括所述多个第一实体中的第一实体集合和所述多个第二实体中的第二实体集合,所述第一实体集合中第一实体的第一简档与所述第二实体集合中第二实体的第二简档相匹配。
11.根据权利要求10所述的装置,还包括:
第一标识获取模块,被配置为获取与所述第一实体集合相对应的第一组身份标识;
第二标识获取模块,被配置为获取与所述第二实体集合相对应的第二组身份标识;以及
实体添加模块,被配置为基于所述第一组身份标识和所述第二组身份标识,使得所述第一实体集合和所述第二实体集合被添加到与所述至少一个匹配集合对应的群组。
12.根据权利要求11所述的装置,其中所述群组为第一群组,所述装置还包括:
移除模块,被配置为如果所述至少一个匹配集合中的目标实体已经存在于与所述第一群组不同的第二群组中,使得所述目标实体从所述第二群组中被移除,其中所述第二群组是基于在先的匹配集合所创建的。
13.根据权利要求11所述的装置,还包括:
提供模块,被配置为在所述群组中提供活动内容,所述活动内容引导所述第一实体集合中的第一实体与所述第二实体集合中的第二实体之间的交互。
14.根据权利要求10所述的装置,其中第一简档包括以下中的至少一项:
与第一实体相关联的位置数据;
与所述第一实体相关联的评价数据;
用于表征所述第一实体提供的所述至少一项对象的属性数据;或
用于表征用户在预定时间段内所获取的对象的获取数据。
15.根据权利要求10所述的装置,其中第二简档包括以下中的至少一项:
与第二实体相关联的评价数据;
所述第二实体提供的引导内容的属性数据;
用于表征所述引导内容的流行程度的流行度数据;
用于表征所述第二实体创建引导内容的频率的活跃度数据;或
与经所述引导内容所引导的用户相关联的引导数据。
16.根据权利要求10所述的装置,其中所述匹配集合确定模块包括:
匹配约束获取模块,被配置为获取至少一项匹配约束,所述至少一项匹配约束至少包括与所述至少一个匹配集合相对应的第一简档约束和第二简档约束;
第一集合确定模块,被配置为从所述多个第一实体中确定所述第一实体集合,所述第一实体集合中第一实体的第一简档满足所述第一简档约束;以及
第二集合确定模块,被配置为从所述多个第二实体中确定所述第二实体集合,所述第二实体集合中第二实体的第二简档满足所述第二简档约束。
17.根据权利要求10所述的装置,还包括:
更新模块,被配置为如果所述多个第一简档中的第一简档被更新或所述多个第二简档中的第二简档被更新,重新确定所述至少一个匹配集合。
18.根据权利要求10所述的装置,其中引导内容包括以下中的至少一项:
语音内容;
文字内容;
图像内容;或
视频内容。
19.一种电子设备,包括:
存储器和处理器;
其中所述存储器用于存储一条或多条计算机指令,其中所述一条或多条计算机指令被所述处理器执行以实现根据权利要求1至9中任一项所述的方法。
20.一种计算机可读存储介质,其上存储有一条或多条计算机指令,其中所述一条或多条计算机指令被处理器执行以实现根据权利要求1至9中任一项所述的方法。
CN202010930071.7A 2020-09-07 2020-09-07 实体聚类的方法、装置、设备和存储介质 Pending CN112101436A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010930071.7A CN112101436A (zh) 2020-09-07 2020-09-07 实体聚类的方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010930071.7A CN112101436A (zh) 2020-09-07 2020-09-07 实体聚类的方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN112101436A true CN112101436A (zh) 2020-12-18

Family

ID=73750742

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010930071.7A Pending CN112101436A (zh) 2020-09-07 2020-09-07 实体聚类的方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN112101436A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103166768A (zh) * 2011-12-12 2013-06-19 阿里巴巴集团控股有限公司 一种匹配信息提供方和信息发布方的方法及装置
CN104823212A (zh) * 2012-11-30 2015-08-05 谷歌公司 提供包括从社交网络得到的信息的内容的系统和方法
US20170046439A1 (en) * 2015-08-12 2017-02-16 Keanr, Inc. Method and apparatus for online group matching
CN106663266A (zh) * 2014-07-13 2017-05-10 微软技术许可有限责任公司 基于生活方式的推荐系统
CN110020188A (zh) * 2017-10-17 2019-07-16 奥多比公司 基于隐式交互和简档数据的全局向量推荐

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103166768A (zh) * 2011-12-12 2013-06-19 阿里巴巴集团控股有限公司 一种匹配信息提供方和信息发布方的方法及装置
CN104823212A (zh) * 2012-11-30 2015-08-05 谷歌公司 提供包括从社交网络得到的信息的内容的系统和方法
CN106663266A (zh) * 2014-07-13 2017-05-10 微软技术许可有限责任公司 基于生活方式的推荐系统
US20170046439A1 (en) * 2015-08-12 2017-02-16 Keanr, Inc. Method and apparatus for online group matching
CN110020188A (zh) * 2017-10-17 2019-07-16 奥多比公司 基于隐式交互和简档数据的全局向量推荐

Similar Documents

Publication Publication Date Title
US9830313B2 (en) Identifying expanding hashtags in a message
US10360644B2 (en) User characteristics-based sponsored company postings
US20130226711A1 (en) Monetizing images in publishing networks
US9959503B2 (en) Filtering automated selection of hashtags for computer modeling
Gu et al. Mobile W eb 2.0 in the workplace: A case study of employees' informal learning
US20200193475A1 (en) Apparatus, method and system for replacing advertising and incentive marketing
WO2022228075A1 (zh) 确定推广方的方法、装置、设备、存储介质和程序产品
US10600087B2 (en) Techniques for facilitating content retargeting
US10296548B2 (en) Delivering content promoting a web page to users of an online system
KR101981612B1 (ko) 인플루언서 마케팅 실행 결과의 분석 서비스 제공 방법
US20160132924A1 (en) Methods and systems for creating event-triggered marketing campaigns
McDonnell et al. Online recruitment of targeted populations: lessons learned from a smoking cessation study among Korean Americans
Nadanyiova et al. Digital marketing as a source of competitive advantage: case study of Slovak Republic
CN112118489B (zh) 群组管理的方法、装置、设备和介质
WO2018023099A1 (en) Contextual entity analysis for electronic content delivery across a computer network
US20170140423A1 (en) System and method for advertising and distributing messages
US9569727B2 (en) Predicting computer model accuracy
JP2014135050A (ja) ビジュアルサーチを利用したコンピュータにより実現される方法、システム及びコンピュータプログラム
US20140067523A1 (en) System and method for online submission, collection, and distribution of product and shopping related information
CN112101436A (zh) 实体聚类的方法、装置、设备和存储介质
US20180218387A1 (en) Feedback system through an online community format
KR102274430B1 (ko) 소셜 네트워크를 이용한 광고 게시글 전파 장치 및 이를 포함하는 시스템
Blazeska et al. The Use of social media as an effective tool for obtaining sustainable competitive advantage
Sion et al. The impact of technology on promoting travel and leisure services in the 21st century
Sabbagh Marketing and Campaign Management via Social Networks and the Effects of Electronic Advertising

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination