CN109697676A - 基于社交群的用户分析及应用方法和装置 - Google Patents
基于社交群的用户分析及应用方法和装置 Download PDFInfo
- Publication number
- CN109697676A CN109697676A CN201811388959.1A CN201811388959A CN109697676A CN 109697676 A CN109697676 A CN 109697676A CN 201811388959 A CN201811388959 A CN 201811388959A CN 109697676 A CN109697676 A CN 109697676A
- Authority
- CN
- China
- Prior art keywords
- user
- social
- analysis result
- information
- social group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 125
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000004141 dimensional analysis Methods 0.000 claims abstract description 91
- 238000003058 natural language processing Methods 0.000 claims abstract description 23
- 238000004590 computer program Methods 0.000 claims description 19
- 235000013399 edible fruits Nutrition 0.000 claims description 10
- 230000010354 integration Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 15
- 238000012163 sequencing technique Methods 0.000 description 6
- 238000001514 detection method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于社交群的用户分析及应用方法和装置。所述用户至少包含于两个社交群中,且所述每个社交群中均包含有机器人账号,该基于社交群的用户分析及应用方法包括:通过机器人账号,基于用户标识采集社交群中用户发出的社交信息,社交信息携带有时间戳信息;根据时间戳信息,采用自然语言处理技术对社交信息进行基于上下文语义的分析,获取每个社交群中用户的单维度分析结果;将用户标识相同的所有单维度分析结果进行整合,得到用户的多维度分析结果;根据用户的多维度分析结果进行与用户相关的应用。采用该方法能够从用户的多个维度出发进行分析,能够提高进行用户应用时的应用效果。
Description
【技术领域】
本发明涉及计算机领域,尤其涉及一种基于社交群的用户分析及应用方法和装置。
【背景技术】
目前在进行与用户相关的应用(即用户应用),如进行对用户的网络言论监控、进行对用户的喜好订阅推送等具体应用时,缺乏对于用户的深度挖掘,无法准确地反映用户的特点,进行的用户应用无法达到预想的应用效果。
【发明内容】
有鉴于此,本发明实施例提供了一种基于社交群的用户分析及应用方法和装置,用以解决在进行用户应用时应用效果差的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种基于社交群的用户分析及应用方法,所述用户至少包含于两个社交群中,且所述每个社交群中均包含有机器人账号,所述方法包括:
通过所述机器人账号,基于用户标识采集所述社交群中用户发出的社交信息,所述社交信息携带有时间戳信息;
根据所述时间戳信息,采用自然语言处理技术对所述社交信息进行基于上下文语义的分析,获取每个所述社交群中用户的单维度分析结果;
将所述用户标识相同的所有所述单维度分析结果进行整合,得到用户的多维度分析结果;
根据所述用户的多维度分析结果进行与用户相关的应用。
进一步地,所述通过所述机器人账号,基于用户标识采集所述社交群中用户发出的社交信息,包括:
通过所述机器人账号对至少两个所述社交群中的用户按照所述用户标识进行划分;
通过所述机器人账号按照划分后的用户采集所述社交群中用户发出的社交信息。
进一步地,所述将所述用户标识相同的所有所述单维度分析结果进行整合,得到用户的多维度分析结果,包括:
查找所述用户的多维度分析结果中重复出现的分析结果;
将所述重复出现的分析结果去除。
进一步地,所述根据所述用户的多维度分析结果进行与用户相关的应用,包括:
根据所述用户的多维度分析结果建立每个用户的用户画像;
根据所述用户画像在所述社交群中为用户推荐订阅内容。
进一步地,所述根据所述用户的多维度分析结果进行与用户相关的应用,包括:
根据所述用户的多维度分析结果为每个用户设定相对应的社交信息的采集频次和每次采集的信息量;
根据所述采集频次和所述每次采集的信息量,采集用户发出的所述社交信息;
根据所述社交信息在网络上对用户进行监督。
为了实现上述目的,根据本发明的一个方面,提供了一种基于社交群的用户分析及应用装置,所述用户至少包含于两个社交群中,且所述每个社交群中均包含有机器人账号,所述装置包括:
采集模块,用于通过所述机器人账号,基于用户标识采集所述社交群中用户发出的社交信息,所述社交信息携带有时间戳信息;
单维度分析结果获取模块,用于根据所述时间戳信息,采用自然语言处理技术对所述社交信息进行基于上下文语义的分析,获取每个所述社交群中用户的单维度分析结果;
多维度分析结果获取模块,用于将所述用户标识相同的所有所述单维度分析结果进行整合,得到用户的多维度分析结果;
应用模块,用于根据所述用户的多维度分析结果进行与用户相关的应用。
进一步地,所述采集模块,包括:
划分单元,用于通过所述机器人账号对至少两个所述社交群中的用户按照所述用户标识进行划分;
采集单元,用于通过所述机器人账号按照划分后的用户采集所述社交群中用户发出的社交信息。
进一步地,所述多维度分析结果获取模块,包括:
重复分析结果查找单元,用于查找所述用户的多维度分析结果中重复出现的分析结果;
去除单元,用于将所述重复出现的分析结果去除。
为了实现上述目的,根据本发明的一个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述的基于社交群的用户分析及应用方法。
为了实现上述目的,根据本发明的一个方面,提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的基于社交群的用户分析及应用方法的步骤。
本发明实施例中,通过机器人账号,基于用户标识采集社交群中用户发出的社交信息,社交信息携带有时间戳信息。采用机器人账号可以保证采集到的社交信息的实时性,获取到的社交信息能够较好地体现用户的特点,能够直接用于用户分析,提高社交信息的利用率。然后根据时间戳信息,采用自然语言处理技术对社交信息进行基于上下文语义的分析,获取每个社交群中用户的单维度分析结果,通过时间戳信息可以正确记录用户发出社交信息的时间顺序,从而进行有效的上下文语义分析,获取用户的分析结果,每个社交群代表着用户每一个维度的分析结果,即单维度分析结果。通过自然语言处理技术可以从社交信息中准确地提炼出用户的特点,在单维度分析结果中将用户的特点充分地展现出来。接着将用户标识相同的所有单维度分析结果进行整合,得到用户的多维度分析结果,基于社交群的多样性,从不同的社交群中提炼出用户在不同维度的特点,在多维度分析结果中将用户特点全面地体现出来。最后根据用户的多维度分析结果进行与用户相关的应用,该多维度分析结果能够准确、全方位地描述用户,根据该多维度分析结果能够提高进行用户应用时的应用效果。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是本发明一实施例中基于社交群的用户分析及应用方法的一流程图;
图2是本发明一实施例中基于社交群的用户分析及应用装置的一示意图。
【具体实施方式】
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述预设范围等,但这些预设范围不应限于这些术语。这些术语仅用来将预设范围彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一预设范围也可以被称为第二预设范围,类似地,第二预设范围也可以被称为第一预设范围。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
图1示出本实施例中基于社交群的用户分析及应用方法的一流程图。该基于社交群的用户分析及应用方法可应用在系统、平台或应用程序中,用于进行用户应用的功能,具体可应用在安装在计算机设备上的用户应用系统中。其中,该计算机设备是可与用户进行人机交互的设备,包括但不限于电脑、智能手机和平板等设备。如图1所示,该基于社交群的用户分析及应用方法包括如下步骤:
S10:通过机器人账号,基于用户标识采集社交群中用户发出的社交信息,社交信息携带有时间戳信息。
其中,用户标识是指唯一用于识别用户身份的标识。社交信息是指用户在社交群上发出的信息,包括言论和操作等。时间戳信息是指一个能表示一份数据在某个特定时间之前已经存在的、完整的、可验证的数据信息,通常是一个字符序列,唯一地标识某一刻的时间。
需要说明的是,在至少两个社交群中添加了专门用于收集社交信息的机器人账号,该机器人账号可以是同一个账号,也可以是不同的多个账号。例如该机器人账号是一个普通账号,每个社交群都添加了这个账号;或者该机器人账号是一个隐藏的管理员账号,在每个社交群有一个单独的账号,通过后台汇总所有机器人账号收集的信息。用户至少包含于两个社交群中,且每个社交群中均包含有机器人账号。
在一实施例中,机器人账号根据用户应用系统发出的采集指令采集社交群中用户发出的社交信息。采用机器人账号可以保证采集到的社交信息的实时性,获取到的社交信息能够较好地体现用户的特点,并且无需对获取的社交信息进行数据清洗,能够直接将社交信息用于用户分析。采用机器人账号采集社交信息可以提高社交信息的利用率。
进一步地,在步骤S10中,通过机器人账号,基于用户标识采集社交群中用户发出的社交信息,具体包括:通过机器人账号对至少两个社交群中的用户按照用户标识进行划分;通过机器人账号按照划分后的用户采集社交群中用户发出的社交信息。
可以理解地,至少两个社交群中存在用户标识相同的用户,以用户标识为划分标准,将不同社交群中的用户根据用户标识进行划分,这样有利于从不同的社交群中提取同一用户的与社交群相关的社交信息,有利于从不同社交群的角度获取用户多个维度的表达,能够塑造出更加立体、全面的用户特点。采集的社交信息以采用用户标识进行划分的用户为基本单位进行采集,采集到的社交信息将会存储在同一用户标识目录下的文件,该社交信息来自于同个用户的不同社交群,而不仅仅是单独的某一个社交群,该社交信息的采集方式能够规范地采集用户在不同社交群中的社交信息。
S20:根据时间戳信息,采用自然语言处理技术对社交信息进行基于上下文语义的分析,获取每个社交群中用户的单维度分析结果。
在一实施例中,根据时间戳信息可以得到用户发出社交信息的时间顺序,从而采用自然语言处理技术对社交信息进行基于上下文语义的分析。其中,自然语言处理(natural language processing,简称NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。自然语言处理技术包括文本朗读(Text tospeech)、语音合成(Speech synthesis)、语音识别(Speech recognition)、中文自动分词(Chinese word segmentation)、词性标注(Part-of-speech tagging)和句法分析(Parsing)等技术。通过该自然语言处理技术从数量庞大的社交信息中分析用户的实际意图,并根据该实际意图提炼、总结出用户在每个社交群上的特点,获取每个社交群中用户的单维度分析结果。可以理解地,一个社交群代表用户的一个维度,对用户在一个社交群上的分析,得到的即用户的单维度分析结果。
在一实施例中,通过时间戳信息可以正确记录用户发出社交信息的时间顺序,从而进行有效的上下文语义分析,获取用户的单维度分析结果。通过自然语言处理技术可以从社交信息中准确地提炼出用户的特点,在单维度分析结果中将用户的特点充分地展现出来。
S30:将用户标识相同的所有单维度分析结果进行整合,得到用户的多维度分析结果。
可以理解地,一个用户唯一对应于一个用户标识,用户在一个社交群中的社交信息代表用户在单个维度上的特点,采用单维度分析结果表示。当将用户标识相同的所有单维度分析结果进行整合、汇总,得到用户的多维度分析结果。该多维分析结果能够准确、全面地体现用户的特点,能够作为进行用户应用的重要参考。
进一步地,在步骤S30中,将用户标识相同的所有单维度分析结果进行整合,得到用户的多维度分析结果,具体包括:查找用户的多维度分析结果中重复出现的分析结果;将重复出现的分析结果去除。
可以理解地,在不同社交群得到的不同的单维度分析结果可能是相同的,因此,可以在用户的多维度分析结果中查找重复出现的分析结果(该重复出现的分析结果可能包含多个单维度分析结果),具体查找的方式可以采用关键字匹配的方法,对多维度分析结果中各个单维度分析结果两两进行匹配,找出相同或相近的单维度分析结果(即重复出现的分析结果),再将重复出现的分析结果去除。去除重复出现的分析结果可以让多维度分析结果更加简洁和准确。
S40:根据用户的多维度分析结果进行与用户相关的应用。
其中,与用户相关的应用即用户应用。
在一实施例中,多维度分析结果能够将用户特点全面地体现出来,根据用户的多维度分析结果进行的与用户相关的应用,提高进行用户应用时的应用效果。
进一步地,在步骤S40中,根据用户的多维度分析结果进行与用户相关的应用,具体包括:根据用户的多维度分析结果建立每个用户的用户画像;根据用户画像在社交群中为用户推荐订阅内容。
可以理解地,根据用户画像在社交群中为用户推荐订阅内容只是其中的一种用户应用,用户画像的建立是有针对性的,以本实施例为例,如果用户画像是为了给用户推荐订阅内容而建立的,则可以在建立用户画像时侧重于与用户兴趣爱好相关的多维度分析结果。建立用户画像实际就是给用户打标签的过程,如某一个人喜爱美食的标签权重的概率为90%、喜爱篮球运动的标签权重为80%和关心时事的标签权重为10%。本实施例中,可以通过采集的多维度分析结果建立用户画像。如一用户在兴趣爱好方面的多维度分析结果为“在社交群中高频次提到篮球明星的名字-喜爱篮球运动”、“社交群中高频次提到美食名和出去吃饭-喜爱美食”和“在社交群中很少提到时事-对时事不怎么感兴趣”,则可以根据该多维度分析结果赋予一个原始权重,根据原始权重计算相应的标签权重。如某一用户的多维度分析结果中包括“社交群中高频次提到美食名和出去寻找美食-喜爱美食”的分析结果,则该用户喜爱美食的标签的原始权重可以设定为70%,之后,根据其他的多维度分析结果与该“喜爱美食”分析结果的关联性进一步调整标签权重,如预先设置有关联关系:喜爱旅游的人也有一部分人喜爱美食,且定义该关联关系的增益权重为5%,则该用户喜爱美食的标签权重变为75%。可以理解地,当该用户的其他多维度分析结果有和“喜爱美食”分析结果具有关联性时(包括正的关联性和负的关联性),将根据预设的增益/消减权重进一步调整,计算得到最终的标签权重,从而根据标签权重得到用户画像,再根据用户画像推荐订阅内容。
进一步地,在步骤S40中,根据用户的多维度分析结果进行与用户相关的应用,具体还可以包括:根据用户的多维度分析结果为每个用户设定相对应的社交信息的采集频次和每次采集的信息量;根据采集频次和每次采集的信息量,采集用户发出的社交信息;根据社交信息在网络上对用户进行监督。
以上给出了两种具体的用户应用的实施方式,根据用户的多维度分析结果,为用户推荐订阅内容,以及根据用户的多维度分析结果为用户设定监控的规则(社交信息的采集频次和每次采集的信息量),对用户在网上的言论进行监督,需要说明的是,此处的社交信息是指在得到用户的多维度分析结果后用户发出的社交信息。
可以理解地,用户应用有多种多样,无论哪种都需要建立在对用户有全面了解、深度解析的基础上才能提高用户应用时的应用效果。
在本方案中,通过机器人账号,基于用户标识采集社交群中用户发出的社交信息,社交信息携带有时间戳信息。采用机器人账号可以保证采集到的社交信息的实时性,获取到的社交信息能够较好地体现用户的特点,能够直接用于用户分析,提高社交信息的利用率。然后根据时间戳信息,采用自然语言处理技术对社交信息进行基于上下文语义的分析,获取每个社交群中用户的单维度分析结果,通过时间戳信息可以正确记录用户发出社交信息的时间顺序,从而进行有效的上下文语义分析,获取用户的分析结果,每个社交群代表着用户每一个维度的分析结果,即单维度分析结果。通过自然语言处理技术可以从社交信息中准确地提炼出用户的特点,在单维度分析结果中将用户的特点充分地展现出来。接着将用户标识相同的所有单维度分析结果进行整合,得到用户的多维度分析结果,基于社交群的多样性,从不同的社交群中提炼出用户在不同维度的特点,在多维度分析结果中将用户特点全面地体现出来。最后根据用户的多维度分析结果进行与用户相关的应用,该多维度分析结果能够准确、全方位地描述用户,根据该多维度分析结果提高进行用户应用时的应用效果。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
本发明实施例提供了一种基于社交群的用户分析及应用装置,该基于社交群的用户分析及应用装置用于执行上述基于社交群的用户分析及应用方法,如图2所示,该装置包括:采集模块10、单维度分析结果获取模块20、多维度分析结果获取模块30和应用模块40。
采集模块10,用于通过机器人账号,基于用户标识采集社交群中用户发出的社交信息,社交信息携带有时间戳信息。
需要说明的是,在至少两个社交群中添加了专门用于收集社交信息的机器人账号,该机器人账号可以是同一个账号,也可以是不同的多个账号。例如该机器人账号是一个普通账号,每个社交群都添加了这个账号;或者该机器人账号是一个隐藏的管理员账号,在每个社交群有一个单独的账号,通过后台汇总所有机器人账号收集的信息。用户至少包含于两个社交群中,且每个社交群中均包含有机器人账号。
在一实施例中,机器人账号根据用户应用系统发出的采集指令采集社交群中用户发出的社交信息。采用机器人账号可以保证采集到的社交信息的实时性,获取到的社交信息能够较好地体现用户的特点,并且无需对获取的社交信息进行数据清洗,能够直接将社交信息用于用户分析。采用机器人账号采集社交信息可以提高社交信息的利用率。
单维度分析结果获取模块20,用于根据时间戳信息,采用自然语言处理技术对社交信息进行基于上下文语义的分析,获取每个社交群中用户的单维度分析结果。
在一实施例中,根据时间戳信息可以得到用户发出社交信息的时间顺序,从而采用自然语言处理技术对社交信息进行基于上下文语义的分析。通过自然语言处理技术从数量庞大的社交信息中分析用户的实际意图,并根据该实际意图提炼、总结出用户在每个社交群上的特点,获取每个社交群中用户的单维度分析结果。可以理解地,一个社交群代表用户的一个维度,对用户在一个社交群上的分析,得到的即用户的单维度分析结果。
在一实施例中,通过时间戳信息可以正确记录用户发出社交信息的时间顺序,从而进行有效的上下文语义分析,获取用户的单维度分析结果。通过自然语言处理技术可以从社交信息中准确地提炼出用户的特点,在单维度分析结果中将用户的特点充分地展现出来。
多维度分析结果获取模块30,用于将用户标识相同的所有单维度分析结果进行整合,得到用户的多维度分析结果。
可以理解地,一个用户唯一对应于一个用户标识,用户在一个社交群中的社交信息代表用户在单个维度上的特点,采用单维度分析结果表示。当将用户标识相同的所有单维度分析结果进行整合、汇总,得到用户的多维度分析结果。该多维分析结果能够准确、全面地体现用户的特点,能够作为进行用户应用的重要参考。
应用模块40,用于根据用户的多维度分析结果进行与用户相关的应用。
在一实施例中,多维度分析结果能够将用户特点全面地体现出来,根据用户的多维度分析结果进行的与用户相关的应用,能够提高用户应用时的应用效果。
可选地,采集模块10,包括划分单元和采集单元。
划分单元,用于通过机器人账号对至少两个社交群中的用户按照用户标识进行划分。
采集单元,用于通过机器人账号按照划分后的用户采集社交群中用户发出的社交信息。
可以理解地,至少两个社交群中存在用户标识相同的用户,以用户标识为划分标准,将不同社交群中的用户根据用户标识进行划分,这样,有利于从不同的社交群中提取同一用户的与社交群相关的社交信息,有利于从不同社交群的角度获取用户多个维度的表达,可以塑造出更加立体、全面的用户特点。采集的社交信息以采用用户标识进行划分的用户为基本单位进行采集,采集到的社交信息将会存储在同一用户标识目录下的文件,该社交信息来自于同个用户的不同社交群,而不仅仅是单独的某一个社交群,该社交信息的采集方式能够规范地采集用户在不同社交群中的社交信息。
可选地,多维度分析结果获取模块30包括:
重复分析结果查找单元,用于查找用户的多维度分析结果中重复出现的分析结果;
去除单元,用于将重复出现的分析结果去除。
可以理解地,在不同社交群得到的不同的单维度分析结果可能是相同的,因此,可以在用户的多维度分析结果中查找重复出现的分析结果(该重复出现的分析结果可能包含多个单维度分析结果),具体查找的方式可以采用关键字匹配的方法,对多维度分析结果中各个单维度分析结果两两进行匹配,找出相同或相近的单维度分析结果(即重复出现的分析结果),再将重复出现的分析结果去除。去除重复出现的分析结果可以让多维度分析结果更加简洁和准确。
可选地,应用模块40包括用户画像建立单元和订阅内容推荐单元。
用户画像建立单元,用于根据用户的多维度分析结果建立每个用户的用户画像。
订阅内容推荐单元,用于根据用户画像在社交群中为用户推荐订阅内容。
可以理解地,根据用户画像在社交群中为用户推荐订阅内容只是其中的一种用户应用,用户画像的建立是有针对性的,以本实施例为例,如果用户画像是为了给用户推荐订阅内容而建立的,则可以在建立用户画像时侧重于与用户兴趣爱好相关的多维度分析结果。建立用户画像实际就是给用户打标签的过程,如某一个人喜爱美食的标签权重的概率为90%、喜爱篮球运动的标签权重为80%和关心时事的标签权重为10%。本实施例中,可以通过采集的多维度分析结果建立用户画像。如一用户在兴趣爱好方面的多维度分析结果为“在社交群中高频次提到篮球明星的名字-喜爱篮球运动”、“社交群中高频次提到美食名和出去吃饭-喜爱美食”和“在社交群中很少提到时事-对时事不怎么感兴趣”。可以根据该多维度分析结果赋予一个原始权重,根据原始权重计算相应的标签权重。如某一用户的多维度分析结果中包括“社交群中高频次提到美食名和出去寻找美食-喜爱美食”的分析结果,则该用户喜爱美食的标签的原始权重可以设定为70%,之后,根据其他的多维度分析结果与该“喜爱美食”分析结果的关联性进一步调整标签权重,如预先设置有关联关系:喜爱旅游的人也有一部分人喜爱美食,且定义该关联关系的增益权重为5%,则该用户喜爱美食的标签权重变为75%。可以理解地,当该用户的其他多维度分析结果有和“喜爱美食”分析结果具有关联性时(包括正的关联性和负的关联性),将根据预设的增益/消减权重进一步调整,计算得到最终的标签权重,从而根据标签权重得到用户画像,再根据用户画像推荐订阅内容。
可选地,应用模块40还可以包括采集频次和采集信息量设定单元、重新采集单元和监督单元。
采集频次和采集信息量设定单元,用于根据用户的多维度分析结果为每个用户设定相对应的社交信息的采集频次和每次采集的信息量。
重新采集单元,用于根据采集频次和每次采集的信息量,采集用户发出的社交信息。
监督单元,用于根据社交信息在网络上对用户进行监督。
可以理解地,用户应用有多种多样,无论哪种都需要建立在对用户有全面了解、深度解析的基础上才能提高进行用户应用时的应用效果。
本发明实施例提供了一种计算机可读存储介质,该计算机可读存储介质包括计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行以下步骤:
通过机器人账号,基于用户标识采集社交群中用户发出的社交信息,社交信息携带有时间戳信息。
根据时间戳信息,采用自然语言处理技术对社交信息进行基于上下文语义的分析,获取每个社交群中用户的单维度分析结果。
将用户标识相同的所有单维度分析结果进行整合,得到用户的多维度分析结果。
根据用户的多维度分析结果进行与用户相关的应用。
可选地,在计算机程序运行时控制计算机可读存储介质所在设备还执行以下步骤:通过机器人账号对至少两个社交群中的用户按照用户标识进行划分;通过机器人账号按照划分后的用户采集社交群中用户发出的社交信息。
可选地,在计算机程序运行时控制计算机可读存储介质所在设备还执行以下步骤:查找用户的多维度分析结果中重复出现的分析结果;将重复出现的分析结果去除。
可选地,在计算机程序运行时控制计算机可读存储介质所在设备还执行以下步骤:根据用户的多维度分析结果建立每个用户的用户画像;根据用户画像在社交群中为用户推荐订阅内容。
可选地,在计算机程序运行时控制计算机可读存储介质所在设备还执行以下步骤:根据用户的多维度分析结果为每个用户设定相对应的社交信息的采集频次和每次采集的信息量;根据采集频次和每次采集的信息量,采集用户发出的社交信息;根据社交信息在网络上对用户进行监督。
本发明实施例提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
通过机器人账号,基于用户标识采集社交群中用户发出的社交信息,社交信息携带有时间戳信息。
根据时间戳信息,采用自然语言处理技术对社交信息进行基于上下文语义的分析,获取每个社交群中用户的单维度分析结果。
将用户标识相同的所有单维度分析结果进行整合,得到用户的多维度分析结果。
根据用户的多维度分析结果进行与用户相关的应用。
可选地,处理器执行计算机程序时还实现以下步骤:通过机器人账号对至少两个社交群中的用户按照用户标识进行划分;通过机器人账号按照划分后的用户采集社交群中用户发出的社交信息。
可选地,处理器执行计算机程序时还实现以下步骤:查找用户的多维度分析结果中重复出现的分析结果;将重复出现的分析结果去除。
可选地,处理器执行计算机程序时还实现以下步骤:根据用户的多维度分析结果建立每个用户的用户画像;根据用户画像在社交群中为用户推荐订阅内容。
可选地,处理器执行计算机程序时还实现以下步骤:根据用户的多维度分析结果为每个用户设定相对应的社交信息的采集频次和每次采集的信息量;根据采集频次和每次采集的信息量,采集用户发出的社交信息;根据社交信息在网络上对用户进行监督。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (10)
1.一种基于社交群的用户分析及应用方法,其特征在于,所述用户至少包含于两个社交群中,且所述每个社交群中均包含有机器人账号,所述方法包括:
通过所述机器人账号,基于用户标识采集所述社交群中用户发出的社交信息,所述社交信息携带有时间戳信息;
根据所述时间戳信息,采用自然语言处理技术对所述社交信息进行基于上下文语义的分析,获取每个所述社交群中用户的单维度分析结果;
将所述用户标识相同的所有所述单维度分析结果进行整合,得到用户的多维度分析结果;
根据所述用户的多维度分析结果进行与用户相关的应用。
2.根据权利要求1所述的方法,其特征在于,所述通过所述机器人账号,基于用户标识采集所述社交群中用户发出的社交信息,包括:
通过所述机器人账号对至少两个所述社交群中的用户按照所述用户标识进行划分;
通过所述机器人账号按照划分后的用户采集所述社交群中用户发出的社交信息。
3.根据权利要求1所述的方法,其特征在于,在所述将所述用户标识相同的所有所述单维度分析结果进行整合,得到用户的多维度分析结果之后,还包括:
查找所述用户的多维度分析结果中重复出现的分析结果;
将所述重复出现的分析结果去除。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述根据所述用户的多维度分析结果进行与用户相关的应用,包括:
根据所述用户的多维度分析结果建立每个用户的用户画像;
根据所述用户画像在所述社交群中为用户推荐订阅内容。
5.根据权利要求1至3任一项所述的方法,其特征在于,所述根据所述用户的多维度分析结果进行与用户相关的应用,包括:
根据所述用户的多维度分析结果为每个用户设定相对应的社交信息的采集频次和每次采集的信息量;
根据所述采集频次和所述每次采集的信息量,采集用户发出的所述社交信息;
根据所述社交信息在网络上对用户进行监督。
6.一种基于社交群的用户分析及应用装置,其特征在于,所述装置包括:
采集模块,用于通过所述机器人账号,基于用户标识采集所述社交群中用户发出的社交信息,所述社交信息携带有时间戳信息;
单维度分析结果获取模块,用于根据所述时间戳信息,采用自然语言处理技术对所述社交信息进行基于上下文语义的分析,获取每个所述社交群中用户的单维度分析结果;
多维度分析结果获取模块,用于将所述用户标识相同的所有所述单维度分析结果进行整合,得到用户的多维度分析结果;
应用模块,用于根据所述用户的多维度分析结果进行与用户相关的应用。
7.根据权利要求6所述的装置,其特征在于,所述采集模块,包括:
划分单元,用于通过所述机器人账号对至少两个所述社交群中的用户按照所述用户标识进行划分;
采集单元,用于通过所述机器人账号按照划分后的用户采集所述社交群中用户发出的社交信息。
8.根据权利要求6所述的装置,其特征在于,所述多维度分析结果获取模块,包括:
重复分析结果查找单元,用于查找所述用户的多维度分析结果中重复出现的分析结果;
去除单元,用于将所述重复出现的分析结果去除。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述基于社交群的用户分析及应用方法的步骤。
10.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述基于社交群的用户分析及应用方法的步骤。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2018112568127 | 2018-10-26 | ||
CN201811256812 | 2018-10-26 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109697676A true CN109697676A (zh) | 2019-04-30 |
CN109697676B CN109697676B (zh) | 2023-06-06 |
Family
ID=66229897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811388959.1A Active CN109697676B (zh) | 2018-10-26 | 2018-11-21 | 基于社交群的用户分析及应用方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109697676B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110489691A (zh) * | 2019-07-03 | 2019-11-22 | 平安证券股份有限公司 | 页面组件显示方法及终端设备 |
CN111931107A (zh) * | 2020-07-31 | 2020-11-13 | 上海博泰悦臻电子设备制造有限公司 | 数字公民体系构建方法、系统及存储介质 |
CN113570293A (zh) * | 2021-09-27 | 2021-10-29 | 深圳我主良缘科技集团有限公司 | 一种基于线上社交信息分析的线下活动信息智能管理系统 |
CN116340302A (zh) * | 2023-03-30 | 2023-06-27 | 呼和浩特市凡诚电子科技有限公司 | 一种基于互联网的计算机数据整合管理系统及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103295149A (zh) * | 2012-01-23 | 2013-09-11 | 穆西格马交易方案私人有限公司 | 社交媒体数据分析系统和方法 |
US20150220628A1 (en) * | 2012-12-18 | 2015-08-06 | Empire Technology Development Llc | Data caching based on social characteristics of users |
CN106504099A (zh) * | 2015-09-07 | 2017-03-15 | 国家计算机网络与信息安全管理中心 | 一种构建用户画像的系统 |
US9612996B1 (en) * | 2013-09-11 | 2017-04-04 | Google Inc. | Providing suggestions to a user based on social activity patterns |
CN106991496A (zh) * | 2017-03-29 | 2017-07-28 | 南京邮电大学 | 一种面向移动社交环境的用户行为分层关联预测方法 |
-
2018
- 2018-11-21 CN CN201811388959.1A patent/CN109697676B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103295149A (zh) * | 2012-01-23 | 2013-09-11 | 穆西格马交易方案私人有限公司 | 社交媒体数据分析系统和方法 |
US20150220628A1 (en) * | 2012-12-18 | 2015-08-06 | Empire Technology Development Llc | Data caching based on social characteristics of users |
US9612996B1 (en) * | 2013-09-11 | 2017-04-04 | Google Inc. | Providing suggestions to a user based on social activity patterns |
CN106504099A (zh) * | 2015-09-07 | 2017-03-15 | 国家计算机网络与信息安全管理中心 | 一种构建用户画像的系统 |
CN106991496A (zh) * | 2017-03-29 | 2017-07-28 | 南京邮电大学 | 一种面向移动社交环境的用户行为分层关联预测方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110489691A (zh) * | 2019-07-03 | 2019-11-22 | 平安证券股份有限公司 | 页面组件显示方法及终端设备 |
CN111931107A (zh) * | 2020-07-31 | 2020-11-13 | 上海博泰悦臻电子设备制造有限公司 | 数字公民体系构建方法、系统及存储介质 |
CN111931107B (zh) * | 2020-07-31 | 2024-03-22 | 博泰车联网科技(上海)股份有限公司 | 数字公民体系构建方法、系统及存储介质 |
CN113570293A (zh) * | 2021-09-27 | 2021-10-29 | 深圳我主良缘科技集团有限公司 | 一种基于线上社交信息分析的线下活动信息智能管理系统 |
CN113570293B (zh) * | 2021-09-27 | 2021-12-31 | 深圳我主良缘科技集团有限公司 | 一种基于线上社交信息分析的线下活动信息智能管理系统 |
CN116340302A (zh) * | 2023-03-30 | 2023-06-27 | 呼和浩特市凡诚电子科技有限公司 | 一种基于互联网的计算机数据整合管理系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109697676B (zh) | 2023-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104915446B (zh) | 基于新闻的事件演化关系自动提取方法及其系统 | |
CN107515877B (zh) | 敏感主题词集的生成方法和装置 | |
CN109697676A (zh) | 基于社交群的用户分析及应用方法和装置 | |
CN101620596B (zh) | 一种面向查询的多文档自动摘要方法 | |
CN108764480A (zh) | 一种信息处理的系统 | |
CN104537341B (zh) | 人脸图片信息获取方法和装置 | |
US10565253B2 (en) | Model generation method, word weighting method, device, apparatus, and computer storage medium | |
CN105095434B (zh) | 时效需求识别方法及装置 | |
CN110489527A (zh) | 基于语音交互的银行业务智能咨询以及办理方法和系统 | |
WO2014015176A1 (en) | Query expansion | |
CN109446328A (zh) | 一种文本识别方法、装置及其存储介质 | |
CN109829045A (zh) | 一种问答方法和装置 | |
CN109739961A (zh) | 一种人机语言交互方法及装置 | |
CN106528655A (zh) | 文本主题识别方法和装置 | |
CN106537387B (zh) | 检索/存储与事件相关联的图像 | |
CN107180087B (zh) | 一种搜索方法及装置 | |
CN110689078A (zh) | 基于人格分类模型的人机交互方法、装置及计算机设备 | |
KR101638535B1 (ko) | 사용자 검색어 연관 이슈패턴 검출 방법, 이를 수행하는 이슈패턴 검출 서버 및 이를 저장하는 기록매체 | |
CN107766234A (zh) | 一种基于移动设备的网页健康度的测评方法、装置及系统 | |
CN108595411B (zh) | 一种同主题文本集合中多文本摘要获取方法 | |
CN113076735A (zh) | 目标信息的获取方法、装置和服务器 | |
CN111708890A (zh) | 一种搜索词确定方法和相关装置 | |
CN110019763B (zh) | 文本过滤方法、系统、设备及计算机可读存储介质 | |
CN110413985B (zh) | 一种相关文本片段搜索方法及装置 | |
CN105095385B (zh) | 一种检索结果的输出方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |