CN109697676B - 基于社交群的用户分析及应用方法和装置 - Google Patents

基于社交群的用户分析及应用方法和装置 Download PDF

Info

Publication number
CN109697676B
CN109697676B CN201811388959.1A CN201811388959A CN109697676B CN 109697676 B CN109697676 B CN 109697676B CN 201811388959 A CN201811388959 A CN 201811388959A CN 109697676 B CN109697676 B CN 109697676B
Authority
CN
China
Prior art keywords
user
social
analysis result
information
dimensional analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811388959.1A
Other languages
English (en)
Other versions
CN109697676A (zh
Inventor
徐佳良
刘劲柏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Financial Technology Co Ltd Shanghai
Original Assignee
OneConnect Financial Technology Co Ltd Shanghai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Financial Technology Co Ltd Shanghai filed Critical OneConnect Financial Technology Co Ltd Shanghai
Publication of CN109697676A publication Critical patent/CN109697676A/zh
Application granted granted Critical
Publication of CN109697676B publication Critical patent/CN109697676B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于社交群的用户分析及应用方法和装置。所述用户至少包含于两个社交群中,且所述每个社交群中均包含有机器人账号,该基于社交群的用户分析及应用方法包括:通过机器人账号,基于用户标识采集社交群中用户发出的社交信息,社交信息携带有时间戳信息;根据时间戳信息,采用自然语言处理技术对社交信息进行基于上下文语义的分析,获取每个社交群中用户的单维度分析结果;将用户标识相同的所有单维度分析结果进行整合,得到用户的多维度分析结果;根据用户的多维度分析结果进行与用户相关的应用。采用该方法能够从用户的多个维度出发进行分析,能够提高进行用户应用时的应用效果。

Description

基于社交群的用户分析及应用方法和装置
【技术领域】
本发明涉及计算机领域,尤其涉及一种基于社交群的用户分析及应用方法和装置。
【背景技术】
目前在进行与用户相关的应用(即用户应用),如进行对用户的网络言论监控、进行对用户的喜好订阅推送等具体应用时,缺乏对于用户的深度挖掘,无法准确地反映用户的特点,进行的用户应用无法达到预想的应用效果。
【发明内容】
有鉴于此,本发明实施例提供了一种基于社交群的用户分析及应用方法和装置,用以解决在进行用户应用时应用效果差的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种基于社交群的用户分析及应用方法,所述用户至少包含于两个社交群中,且所述每个社交群中均包含有机器人账号,所述方法包括:
通过所述机器人账号,基于用户标识采集所述社交群中用户发出的社交信息,所述社交信息携带有时间戳信息;
根据所述时间戳信息,采用自然语言处理技术对所述社交信息进行基于上下文语义的分析,获取每个所述社交群中用户的单维度分析结果;
将所述用户标识相同的所有所述单维度分析结果进行整合,得到用户的多维度分析结果;
根据所述用户的多维度分析结果进行与用户相关的应用。
进一步地,所述通过所述机器人账号,基于用户标识采集所述社交群中用户发出的社交信息,包括:
通过所述机器人账号对至少两个所述社交群中的用户按照所述用户标识进行划分;
通过所述机器人账号按照划分后的用户采集所述社交群中用户发出的社交信息。
进一步地,所述将所述用户标识相同的所有所述单维度分析结果进行整合,得到用户的多维度分析结果,包括:
查找所述用户的多维度分析结果中重复出现的分析结果;
将所述重复出现的分析结果去除。
进一步地,所述根据所述用户的多维度分析结果进行与用户相关的应用,包括:
根据所述用户的多维度分析结果建立每个用户的用户画像;
根据所述用户画像在所述社交群中为用户推荐订阅内容。
进一步地,所述根据所述用户的多维度分析结果进行与用户相关的应用,包括:
根据所述用户的多维度分析结果为每个用户设定相对应的社交信息的采集频次和每次采集的信息量;
根据所述采集频次和所述每次采集的信息量,采集用户发出的所述社交信息;
根据所述社交信息在网络上对用户进行监督。
为了实现上述目的,根据本发明的一个方面,提供了一种基于社交群的用户分析及应用装置,所述用户至少包含于两个社交群中,且所述每个社交群中均包含有机器人账号,所述装置包括:
采集模块,用于通过所述机器人账号,基于用户标识采集所述社交群中用户发出的社交信息,所述社交信息携带有时间戳信息;
单维度分析结果获取模块,用于根据所述时间戳信息,采用自然语言处理技术对所述社交信息进行基于上下文语义的分析,获取每个所述社交群中用户的单维度分析结果;
多维度分析结果获取模块,用于将所述用户标识相同的所有所述单维度分析结果进行整合,得到用户的多维度分析结果;
应用模块,用于根据所述用户的多维度分析结果进行与用户相关的应用。
进一步地,所述采集模块,包括:
划分单元,用于通过所述机器人账号对至少两个所述社交群中的用户按照所述用户标识进行划分;
采集单元,用于通过所述机器人账号按照划分后的用户采集所述社交群中用户发出的社交信息。
进一步地,所述多维度分析结果获取模块,包括:
重复分析结果查找单元,用于查找所述用户的多维度分析结果中重复出现的分析结果;
去除单元,用于将所述重复出现的分析结果去除。
为了实现上述目的,根据本发明的一个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述的基于社交群的用户分析及应用方法。
为了实现上述目的,根据本发明的一个方面,提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的基于社交群的用户分析及应用方法的步骤。
本发明实施例中,通过机器人账号,基于用户标识采集社交群中用户发出的社交信息,社交信息携带有时间戳信息。采用机器人账号可以保证采集到的社交信息的实时性,获取到的社交信息能够较好地体现用户的特点,能够直接用于用户分析,提高社交信息的利用率。然后根据时间戳信息,采用自然语言处理技术对社交信息进行基于上下文语义的分析,获取每个社交群中用户的单维度分析结果,通过时间戳信息可以正确记录用户发出社交信息的时间顺序,从而进行有效的上下文语义分析,获取用户的分析结果,每个社交群代表着用户每一个维度的分析结果,即单维度分析结果。通过自然语言处理技术可以从社交信息中准确地提炼出用户的特点,在单维度分析结果中将用户的特点充分地展现出来。接着将用户标识相同的所有单维度分析结果进行整合,得到用户的多维度分析结果,基于社交群的多样性,从不同的社交群中提炼出用户在不同维度的特点,在多维度分析结果中将用户特点全面地体现出来。最后根据用户的多维度分析结果进行与用户相关的应用,该多维度分析结果能够准确、全方位地描述用户,根据该多维度分析结果能够提高进行用户应用时的应用效果。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是本发明一实施例中基于社交群的用户分析及应用方法的一流程图;
图2是本发明一实施例中基于社交群的用户分析及应用装置的一示意图。
【具体实施方式】
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述预设范围等,但这些预设范围不应限于这些术语。这些术语仅用来将预设范围彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一预设范围也可以被称为第二预设范围,类似地,第二预设范围也可以被称为第一预设范围。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
图1示出本实施例中基于社交群的用户分析及应用方法的一流程图。该基于社交群的用户分析及应用方法可应用在系统、平台或应用程序中,用于进行用户应用的功能,具体可应用在安装在计算机设备上的用户应用系统中。其中,该计算机设备是可与用户进行人机交互的设备,包括但不限于电脑、智能手机和平板等设备。如图1所示,该基于社交群的用户分析及应用方法包括如下步骤:
S10:通过机器人账号,基于用户标识采集社交群中用户发出的社交信息,社交信息携带有时间戳信息。
其中,用户标识是指唯一用于识别用户身份的标识。社交信息是指用户在社交群上发出的信息,包括言论和操作等。时间戳信息是指一个能表示一份数据在某个特定时间之前已经存在的、完整的、可验证的数据信息,通常是一个字符序列,唯一地标识某一刻的时间。
需要说明的是,在至少两个社交群中添加了专门用于收集社交信息的机器人账号,该机器人账号可以是同一个账号,也可以是不同的多个账号。例如该机器人账号是一个普通账号,每个社交群都添加了这个账号;或者该机器人账号是一个隐藏的管理员账号,在每个社交群有一个单独的账号,通过后台汇总所有机器人账号收集的信息。用户至少包含于两个社交群中,且每个社交群中均包含有机器人账号。
在一实施例中,机器人账号根据用户应用系统发出的采集指令采集社交群中用户发出的社交信息。采用机器人账号可以保证采集到的社交信息的实时性,获取到的社交信息能够较好地体现用户的特点,并且无需对获取的社交信息进行数据清洗,能够直接将社交信息用于用户分析。采用机器人账号采集社交信息可以提高社交信息的利用率。
进一步地,在步骤S10中,通过机器人账号,基于用户标识采集社交群中用户发出的社交信息,具体包括:通过机器人账号对至少两个社交群中的用户按照用户标识进行划分;通过机器人账号按照划分后的用户采集社交群中用户发出的社交信息。
可以理解地,至少两个社交群中存在用户标识相同的用户,以用户标识为划分标准,将不同社交群中的用户根据用户标识进行划分,这样有利于从不同的社交群中提取同一用户的与社交群相关的社交信息,有利于从不同社交群的角度获取用户多个维度的表达,能够塑造出更加立体、全面的用户特点。采集的社交信息以采用用户标识进行划分的用户为基本单位进行采集,采集到的社交信息将会存储在同一用户标识目录下的文件,该社交信息来自于同个用户的不同社交群,而不仅仅是单独的某一个社交群,该社交信息的采集方式能够规范地采集用户在不同社交群中的社交信息。
S20:根据时间戳信息,采用自然语言处理技术对社交信息进行基于上下文语义的分析,获取每个社交群中用户的单维度分析结果。
在一实施例中,根据时间戳信息可以得到用户发出社交信息的时间顺序,从而采用自然语言处理技术对社交信息进行基于上下文语义的分析。其中,自然语言处理(natural language processing,简称NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。自然语言处理技术包括文本朗读(Text tospeech)、语音合成(Speech synthesis)、语音识别(Speech recognition)、中文自动分词(Chinese word segmentation)、词性标注(Part-of-speech tagging)和句法分析(Parsing)等技术。通过该自然语言处理技术从数量庞大的社交信息中分析用户的实际意图,并根据该实际意图提炼、总结出用户在每个社交群上的特点,获取每个社交群中用户的单维度分析结果。可以理解地,一个社交群代表用户的一个维度,对用户在一个社交群上的分析,得到的即用户的单维度分析结果。
在一实施例中,通过时间戳信息可以正确记录用户发出社交信息的时间顺序,从而进行有效的上下文语义分析,获取用户的单维度分析结果。通过自然语言处理技术可以从社交信息中准确地提炼出用户的特点,在单维度分析结果中将用户的特点充分地展现出来。
S30:将用户标识相同的所有单维度分析结果进行整合,得到用户的多维度分析结果。
可以理解地,一个用户唯一对应于一个用户标识,用户在一个社交群中的社交信息代表用户在单个维度上的特点,采用单维度分析结果表示。当将用户标识相同的所有单维度分析结果进行整合、汇总,得到用户的多维度分析结果。该多维分析结果能够准确、全面地体现用户的特点,能够作为进行用户应用的重要参考。
进一步地,在步骤S30中,将用户标识相同的所有单维度分析结果进行整合,得到用户的多维度分析结果,具体包括:查找用户的多维度分析结果中重复出现的分析结果;将重复出现的分析结果去除。
可以理解地,在不同社交群得到的不同的单维度分析结果可能是相同的,因此,可以在用户的多维度分析结果中查找重复出现的分析结果(该重复出现的分析结果可能包含多个单维度分析结果),具体查找的方式可以采用关键字匹配的方法,对多维度分析结果中各个单维度分析结果两两进行匹配,找出相同或相近的单维度分析结果(即重复出现的分析结果),再将重复出现的分析结果去除。去除重复出现的分析结果可以让多维度分析结果更加简洁和准确。
S40:根据用户的多维度分析结果进行与用户相关的应用。
其中,与用户相关的应用即用户应用。
在一实施例中,多维度分析结果能够将用户特点全面地体现出来,根据用户的多维度分析结果进行的与用户相关的应用,提高进行用户应用时的应用效果。
进一步地,在步骤S40中,根据用户的多维度分析结果进行与用户相关的应用,具体包括:根据用户的多维度分析结果建立每个用户的用户画像;根据用户画像在社交群中为用户推荐订阅内容。
可以理解地,根据用户画像在社交群中为用户推荐订阅内容只是其中的一种用户应用,用户画像的建立是有针对性的,以本实施例为例,如果用户画像是为了给用户推荐订阅内容而建立的,则可以在建立用户画像时侧重于与用户兴趣爱好相关的多维度分析结果。建立用户画像实际就是给用户打标签的过程,如某一个人喜爱美食的标签权重的概率为90%、喜爱篮球运动的标签权重为80%和关心时事的标签权重为10%。本实施例中,可以通过采集的多维度分析结果建立用户画像。如一用户在兴趣爱好方面的多维度分析结果为“在社交群中高频次提到篮球明星的名字-喜爱篮球运动”、“社交群中高频次提到美食名和出去吃饭-喜爱美食”和“在社交群中很少提到时事-对时事不怎么感兴趣”,则可以根据该多维度分析结果赋予一个原始权重,根据原始权重计算相应的标签权重。如某一用户的多维度分析结果中包括“社交群中高频次提到美食名和出去寻找美食-喜爱美食”的分析结果,则该用户喜爱美食的标签的原始权重可以设定为70%,之后,根据其他的多维度分析结果与该“喜爱美食”分析结果的关联性进一步调整标签权重,如预先设置有关联关系:喜爱旅游的人也有一部分人喜爱美食,且定义该关联关系的增益权重为5%,则该用户喜爱美食的标签权重变为75%。可以理解地,当该用户的其他多维度分析结果有和“喜爱美食”分析结果具有关联性时(包括正的关联性和负的关联性),将根据预设的增益/消减权重进一步调整,计算得到最终的标签权重,从而根据标签权重得到用户画像,再根据用户画像推荐订阅内容。
进一步地,在步骤S40中,根据用户的多维度分析结果进行与用户相关的应用,具体还可以包括:根据用户的多维度分析结果为每个用户设定相对应的社交信息的采集频次和每次采集的信息量;根据采集频次和每次采集的信息量,采集用户发出的社交信息;根据社交信息在网络上对用户进行监督。
以上给出了两种具体的用户应用的实施方式,根据用户的多维度分析结果,为用户推荐订阅内容,以及根据用户的多维度分析结果为用户设定监控的规则(社交信息的采集频次和每次采集的信息量),对用户在网上的言论进行监督,需要说明的是,此处的社交信息是指在得到用户的多维度分析结果后用户发出的社交信息。
可以理解地,用户应用有多种多样,无论哪种都需要建立在对用户有全面了解、深度解析的基础上才能提高用户应用时的应用效果。
在本方案中,通过机器人账号,基于用户标识采集社交群中用户发出的社交信息,社交信息携带有时间戳信息。采用机器人账号可以保证采集到的社交信息的实时性,获取到的社交信息能够较好地体现用户的特点,能够直接用于用户分析,提高社交信息的利用率。然后根据时间戳信息,采用自然语言处理技术对社交信息进行基于上下文语义的分析,获取每个社交群中用户的单维度分析结果,通过时间戳信息可以正确记录用户发出社交信息的时间顺序,从而进行有效的上下文语义分析,获取用户的分析结果,每个社交群代表着用户每一个维度的分析结果,即单维度分析结果。通过自然语言处理技术可以从社交信息中准确地提炼出用户的特点,在单维度分析结果中将用户的特点充分地展现出来。接着将用户标识相同的所有单维度分析结果进行整合,得到用户的多维度分析结果,基于社交群的多样性,从不同的社交群中提炼出用户在不同维度的特点,在多维度分析结果中将用户特点全面地体现出来。最后根据用户的多维度分析结果进行与用户相关的应用,该多维度分析结果能够准确、全方位地描述用户,根据该多维度分析结果提高进行用户应用时的应用效果。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
本发明实施例提供了一种基于社交群的用户分析及应用装置,该基于社交群的用户分析及应用装置用于执行上述基于社交群的用户分析及应用方法,如图2所示,该装置包括:采集模块10、单维度分析结果获取模块20、多维度分析结果获取模块30和应用模块40。
采集模块10,用于通过机器人账号,基于用户标识采集社交群中用户发出的社交信息,社交信息携带有时间戳信息。
需要说明的是,在至少两个社交群中添加了专门用于收集社交信息的机器人账号,该机器人账号可以是同一个账号,也可以是不同的多个账号。例如该机器人账号是一个普通账号,每个社交群都添加了这个账号;或者该机器人账号是一个隐藏的管理员账号,在每个社交群有一个单独的账号,通过后台汇总所有机器人账号收集的信息。用户至少包含于两个社交群中,且每个社交群中均包含有机器人账号。
在一实施例中,机器人账号根据用户应用系统发出的采集指令采集社交群中用户发出的社交信息。采用机器人账号可以保证采集到的社交信息的实时性,获取到的社交信息能够较好地体现用户的特点,并且无需对获取的社交信息进行数据清洗,能够直接将社交信息用于用户分析。采用机器人账号采集社交信息可以提高社交信息的利用率。
单维度分析结果获取模块20,用于根据时间戳信息,采用自然语言处理技术对社交信息进行基于上下文语义的分析,获取每个社交群中用户的单维度分析结果。
在一实施例中,根据时间戳信息可以得到用户发出社交信息的时间顺序,从而采用自然语言处理技术对社交信息进行基于上下文语义的分析。通过自然语言处理技术从数量庞大的社交信息中分析用户的实际意图,并根据该实际意图提炼、总结出用户在每个社交群上的特点,获取每个社交群中用户的单维度分析结果。可以理解地,一个社交群代表用户的一个维度,对用户在一个社交群上的分析,得到的即用户的单维度分析结果。
在一实施例中,通过时间戳信息可以正确记录用户发出社交信息的时间顺序,从而进行有效的上下文语义分析,获取用户的单维度分析结果。通过自然语言处理技术可以从社交信息中准确地提炼出用户的特点,在单维度分析结果中将用户的特点充分地展现出来。
多维度分析结果获取模块30,用于将用户标识相同的所有单维度分析结果进行整合,得到用户的多维度分析结果。
可以理解地,一个用户唯一对应于一个用户标识,用户在一个社交群中的社交信息代表用户在单个维度上的特点,采用单维度分析结果表示。当将用户标识相同的所有单维度分析结果进行整合、汇总,得到用户的多维度分析结果。该多维分析结果能够准确、全面地体现用户的特点,能够作为进行用户应用的重要参考。
应用模块40,用于根据用户的多维度分析结果进行与用户相关的应用。
在一实施例中,多维度分析结果能够将用户特点全面地体现出来,根据用户的多维度分析结果进行的与用户相关的应用,能够提高用户应用时的应用效果。
可选地,采集模块10,包括划分单元和采集单元。
划分单元,用于通过机器人账号对至少两个社交群中的用户按照用户标识进行划分。
采集单元,用于通过机器人账号按照划分后的用户采集社交群中用户发出的社交信息。
可以理解地,至少两个社交群中存在用户标识相同的用户,以用户标识为划分标准,将不同社交群中的用户根据用户标识进行划分,这样,有利于从不同的社交群中提取同一用户的与社交群相关的社交信息,有利于从不同社交群的角度获取用户多个维度的表达,可以塑造出更加立体、全面的用户特点。采集的社交信息以采用用户标识进行划分的用户为基本单位进行采集,采集到的社交信息将会存储在同一用户标识目录下的文件,该社交信息来自于同个用户的不同社交群,而不仅仅是单独的某一个社交群,该社交信息的采集方式能够规范地采集用户在不同社交群中的社交信息。
可选地,多维度分析结果获取模块30包括:
重复分析结果查找单元,用于查找用户的多维度分析结果中重复出现的分析结果;
去除单元,用于将重复出现的分析结果去除。
可以理解地,在不同社交群得到的不同的单维度分析结果可能是相同的,因此,可以在用户的多维度分析结果中查找重复出现的分析结果(该重复出现的分析结果可能包含多个单维度分析结果),具体查找的方式可以采用关键字匹配的方法,对多维度分析结果中各个单维度分析结果两两进行匹配,找出相同或相近的单维度分析结果(即重复出现的分析结果),再将重复出现的分析结果去除。去除重复出现的分析结果可以让多维度分析结果更加简洁和准确。
可选地,应用模块40包括用户画像建立单元和订阅内容推荐单元。
用户画像建立单元,用于根据用户的多维度分析结果建立每个用户的用户画像。
订阅内容推荐单元,用于根据用户画像在社交群中为用户推荐订阅内容。
可以理解地,根据用户画像在社交群中为用户推荐订阅内容只是其中的一种用户应用,用户画像的建立是有针对性的,以本实施例为例,如果用户画像是为了给用户推荐订阅内容而建立的,则可以在建立用户画像时侧重于与用户兴趣爱好相关的多维度分析结果。建立用户画像实际就是给用户打标签的过程,如某一个人喜爱美食的标签权重的概率为90%、喜爱篮球运动的标签权重为80%和关心时事的标签权重为10%。本实施例中,可以通过采集的多维度分析结果建立用户画像。如一用户在兴趣爱好方面的多维度分析结果为“在社交群中高频次提到篮球明星的名字-喜爱篮球运动”、“社交群中高频次提到美食名和出去吃饭-喜爱美食”和“在社交群中很少提到时事-对时事不怎么感兴趣”。可以根据该多维度分析结果赋予一个原始权重,根据原始权重计算相应的标签权重。如某一用户的多维度分析结果中包括“社交群中高频次提到美食名和出去寻找美食-喜爱美食”的分析结果,则该用户喜爱美食的标签的原始权重可以设定为70%,之后,根据其他的多维度分析结果与该“喜爱美食”分析结果的关联性进一步调整标签权重,如预先设置有关联关系:喜爱旅游的人也有一部分人喜爱美食,且定义该关联关系的增益权重为5%,则该用户喜爱美食的标签权重变为75%。可以理解地,当该用户的其他多维度分析结果有和“喜爱美食”分析结果具有关联性时(包括正的关联性和负的关联性),将根据预设的增益/消减权重进一步调整,计算得到最终的标签权重,从而根据标签权重得到用户画像,再根据用户画像推荐订阅内容。
可选地,应用模块40还可以包括采集频次和采集信息量设定单元、重新采集单元和监督单元。
采集频次和采集信息量设定单元,用于根据用户的多维度分析结果为每个用户设定相对应的社交信息的采集频次和每次采集的信息量。
重新采集单元,用于根据采集频次和每次采集的信息量,采集用户发出的社交信息。
监督单元,用于根据社交信息在网络上对用户进行监督。
可以理解地,用户应用有多种多样,无论哪种都需要建立在对用户有全面了解、深度解析的基础上才能提高进行用户应用时的应用效果。
本发明实施例提供了一种计算机可读存储介质,该计算机可读存储介质包括计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行以下步骤:
通过机器人账号,基于用户标识采集社交群中用户发出的社交信息,社交信息携带有时间戳信息。
根据时间戳信息,采用自然语言处理技术对社交信息进行基于上下文语义的分析,获取每个社交群中用户的单维度分析结果。
将用户标识相同的所有单维度分析结果进行整合,得到用户的多维度分析结果。
根据用户的多维度分析结果进行与用户相关的应用。
可选地,在计算机程序运行时控制计算机可读存储介质所在设备还执行以下步骤:通过机器人账号对至少两个社交群中的用户按照用户标识进行划分;通过机器人账号按照划分后的用户采集社交群中用户发出的社交信息。
可选地,在计算机程序运行时控制计算机可读存储介质所在设备还执行以下步骤:查找用户的多维度分析结果中重复出现的分析结果;将重复出现的分析结果去除。
可选地,在计算机程序运行时控制计算机可读存储介质所在设备还执行以下步骤:根据用户的多维度分析结果建立每个用户的用户画像;根据用户画像在社交群中为用户推荐订阅内容。
可选地,在计算机程序运行时控制计算机可读存储介质所在设备还执行以下步骤:根据用户的多维度分析结果为每个用户设定相对应的社交信息的采集频次和每次采集的信息量;根据采集频次和每次采集的信息量,采集用户发出的社交信息;根据社交信息在网络上对用户进行监督。
本发明实施例提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
通过机器人账号,基于用户标识采集社交群中用户发出的社交信息,社交信息携带有时间戳信息。
根据时间戳信息,采用自然语言处理技术对社交信息进行基于上下文语义的分析,获取每个社交群中用户的单维度分析结果。
将用户标识相同的所有单维度分析结果进行整合,得到用户的多维度分析结果。
根据用户的多维度分析结果进行与用户相关的应用。
可选地,处理器执行计算机程序时还实现以下步骤:通过机器人账号对至少两个社交群中的用户按照用户标识进行划分;通过机器人账号按照划分后的用户采集社交群中用户发出的社交信息。
可选地,处理器执行计算机程序时还实现以下步骤:查找用户的多维度分析结果中重复出现的分析结果;将重复出现的分析结果去除。
可选地,处理器执行计算机程序时还实现以下步骤:根据用户的多维度分析结果建立每个用户的用户画像;根据用户画像在社交群中为用户推荐订阅内容。
可选地,处理器执行计算机程序时还实现以下步骤:根据用户的多维度分析结果为每个用户设定相对应的社交信息的采集频次和每次采集的信息量;根据采集频次和每次采集的信息量,采集用户发出的社交信息;根据社交信息在网络上对用户进行监督。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (10)

1.一种基于社交群的用户分析及应用方法,其特征在于,所述用户至少包含于两个社交群中,且每个社交群中均包含有机器人账号,所述方法包括:
通过所述机器人账号,基于用户标识采集所述社交群中用户发出的社交信息,所述社交信息携带有时间戳信息;
根据所述时间戳信息,采用自然语言处理技术对所述社交信息进行基于上下文语义的分析,获取每个所述社交群中用户的单维度分析结果;
将所述用户标识相同的所有所述单维度分析结果进行整合,得到用户的多维度分析结果;
根据所述用户的多维度分析结果进行与用户相关的应用。
2.根据权利要求1所述的方法,其特征在于,所述通过所述机器人账号,基于用户标识采集所述社交群中用户发出的社交信息,包括:
通过所述机器人账号对至少两个所述社交群中的用户按照所述用户标识进行划分;
通过所述机器人账号按照划分后的用户采集所述社交群中用户发出的社交信息。
3.根据权利要求1所述的方法,其特征在于,在所述将所述用户标识相同的所有所述单维度分析结果进行整合,得到用户的多维度分析结果之后,还包括:
查找所述用户的多维度分析结果中重复出现的分析结果;
将所述重复出现的分析结果去除。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述根据所述用户的多维度分析结果进行与用户相关的应用,包括:
根据所述用户的多维度分析结果建立每个用户的用户画像;
根据所述用户画像在所述社交群中为用户推荐订阅内容。
5.根据权利要求1至3任一项所述的方法,其特征在于,所述根据所述用户的多维度分析结果进行与用户相关的应用,包括:
根据所述用户的多维度分析结果为每个用户设定相对应的社交信息的采集频次和每次采集的信息量;
根据所述采集频次和所述每次采集的信息量,采集用户发出的所述社交信息;
根据所述社交信息在网络上对用户进行监督。
6.一种基于社交群的用户分析及应用装置,其特征在于,所述用户至少包含于两个社交群中,且每个社交群中均包含有机器人账号,所述装置包括:
采集模块,用于通过机器人账号,基于用户标识采集所述社交群中用户发出的社交信息,所述社交信息携带有时间戳信息;
单维度分析结果获取模块,用于根据所述时间戳信息,采用自然语言处理技术对所述社交信息进行基于上下文语义的分析,获取每个所述社交群中用户的单维度分析结果;
多维度分析结果获取模块,用于将所述用户标识相同的所有所述单维度分析结果进行整合,得到用户的多维度分析结果;
应用模块,用于根据所述用户的多维度分析结果进行与用户相关的应用。
7.根据权利要求6所述的装置,其特征在于,所述采集模块,包括:
划分单元,用于通过所述机器人账号对至少两个所述社交群中的用户按照所述用户标识进行划分;
采集单元,用于通过所述机器人账号按照划分后的用户采集所述社交群中用户发出的社交信息。
8.根据权利要求6所述的装置,其特征在于,所述多维度分析结果获取模块,包括:
重复分析结果查找单元,用于查找所述用户的多维度分析结果中重复出现的分析结果;
去除单元,用于将所述重复出现的分析结果去除。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述基于社交群的用户分析及应用方法的步骤。
10.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述基于社交群的用户分析及应用方法的步骤。
CN201811388959.1A 2018-10-26 2018-11-21 基于社交群的用户分析及应用方法和装置 Active CN109697676B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201811256812 2018-10-26
CN2018112568127 2018-10-26

Publications (2)

Publication Number Publication Date
CN109697676A CN109697676A (zh) 2019-04-30
CN109697676B true CN109697676B (zh) 2023-06-06

Family

ID=66229897

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811388959.1A Active CN109697676B (zh) 2018-10-26 2018-11-21 基于社交群的用户分析及应用方法和装置

Country Status (1)

Country Link
CN (1) CN109697676B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110489691A (zh) * 2019-07-03 2019-11-22 平安证券股份有限公司 页面组件显示方法及终端设备
CN111931107B (zh) * 2020-07-31 2024-03-22 博泰车联网科技(上海)股份有限公司 数字公民体系构建方法、系统及存储介质
CN113570293B (zh) * 2021-09-27 2021-12-31 深圳我主良缘科技集团有限公司 一种基于线上社交信息分析的线下活动信息智能管理系统
CN116340302A (zh) * 2023-03-30 2023-06-27 呼和浩特市凡诚电子科技有限公司 一种基于互联网的计算机数据整合管理系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103295149A (zh) * 2012-01-23 2013-09-11 穆西格马交易方案私人有限公司 社交媒体数据分析系统和方法
CN106504099A (zh) * 2015-09-07 2017-03-15 国家计算机网络与信息安全管理中心 一种构建用户画像的系统
US9612996B1 (en) * 2013-09-11 2017-04-04 Google Inc. Providing suggestions to a user based on social activity patterns
CN106991496A (zh) * 2017-03-29 2017-07-28 南京邮电大学 一种面向移动社交环境的用户行为分层关联预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10235451B2 (en) * 2012-12-18 2019-03-19 Empire Technology Development Llc Data caching based on social characteristics of users

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103295149A (zh) * 2012-01-23 2013-09-11 穆西格马交易方案私人有限公司 社交媒体数据分析系统和方法
US9612996B1 (en) * 2013-09-11 2017-04-04 Google Inc. Providing suggestions to a user based on social activity patterns
CN106504099A (zh) * 2015-09-07 2017-03-15 国家计算机网络与信息安全管理中心 一种构建用户画像的系统
CN106991496A (zh) * 2017-03-29 2017-07-28 南京邮电大学 一种面向移动社交环境的用户行为分层关联预测方法

Also Published As

Publication number Publication date
CN109697676A (zh) 2019-04-30

Similar Documents

Publication Publication Date Title
CN109697676B (zh) 基于社交群的用户分析及应用方法和装置
CN107515877B (zh) 敏感主题词集的生成方法和装置
CN110413875B (zh) 一种文本信息推送的方法以及相关装置
US11176453B2 (en) System and method for detangling of interleaved conversations in communication platforms
CN109408821B (zh) 一种语料生成方法、装置、计算设备及存储介质
US11288590B2 (en) Automatic generation of training sets using subject matter experts on social media
CN108305180B (zh) 一种好友推荐方法及装置
CN105357586A (zh) 视频弹幕过滤方法及装置
CN112883258B (zh) 信息推荐方法、装置、电子设备及存储介质
CN107193974B (zh) 基于人工智能的地域性信息确定方法和装置
CN110019703B (zh) 数据标记方法及装置、智能问答方法及系统
CN110119477B (zh) 一种信息推送方法、装置和存储介质
CN111198946A (zh) 一种网络新闻热点挖掘方法及装置
CN112464036B (zh) 一种违规数据的审核方法及装置
CN112347339A (zh) 一种搜索结果处理方法及装置
CN111026967A (zh) 一种获得用户兴趣标签的方法、装置、设备和介质
CN112989824A (zh) 信息推送方法及装置、电子设备及存储介质
CN110413882B (zh) 信息推送方法、装置及设备
CN106446051A (zh) Eagle媒资深度搜索方法
CN111491209A (zh) 视频封面确定方法、装置、电子设备和存储介质
CN112581297B (zh) 基于人工智能的信息推送方法、装置及计算机设备
CN112131877B (zh) 一种海量数据下的实时中文文本分词方法
CN110245233A (zh) 一种故障确定方法及装置
CN113537206B (zh) 推送数据检测方法、装置、计算机设备和存储介质
CN117312518A (zh) 一种智能问答方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant