CN104731982A - 一种动态群演化生成方法 - Google Patents

一种动态群演化生成方法 Download PDF

Info

Publication number
CN104731982A
CN104731982A CN201510182467.7A CN201510182467A CN104731982A CN 104731982 A CN104731982 A CN 104731982A CN 201510182467 A CN201510182467 A CN 201510182467A CN 104731982 A CN104731982 A CN 104731982A
Authority
CN
China
Prior art keywords
user
dynamic group
speech
theme
descriptor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510182467.7A
Other languages
English (en)
Other versions
CN104731982B (zh
Inventor
许延祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xintang Zhichuang Electronic Technology Co.,Ltd.
Original Assignee
Daily Amy (beijing) Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Daily Amy (beijing) Network Technology Co Ltd filed Critical Daily Amy (beijing) Network Technology Co Ltd
Priority to CN201510182467.7A priority Critical patent/CN104731982B/zh
Publication of CN104731982A publication Critical patent/CN104731982A/zh
Application granted granted Critical
Publication of CN104731982B publication Critical patent/CN104731982B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种动态群演化生成方法,包括如下步骤:(1)设置动态群条件;(2)持续监控提取用户发言,并提取发言主题;(3)根据发言和发言主题生成用户标签;(4)寻找相同标签用户群,邀请用户加入该动态群;(5)清退低兴趣度用户;(6)监控并处理新主题词的提取与替换;(7)处理结束话题。本发明的优点体现在:本发明能够更细粒度地促进用户活跃度,使参与交流的用户具有更高的主题相关度,从而提高社交软件整体的用户活跃度和用户满意度,提高平台的用户黏性。

Description

一种动态群演化生成方法
技术领域
本发明涉及互联网应用、社交群管理领域,具体涉及一种动态群演化生成方法。
背景技术
当前的社交类应用软件对于用户社交群管理通常采用一种固定模式,即“创建群—用户加入群---用户在群中交流”。但是,这样模式面临着一个问题是:每个群中的交流实际上是由一个个具体的话题构成,由于群中用户个体间的关注差异,群中话题通常并不具有普适性,因而,往往真正参与交流的人数总是只占群中用户的一小部分,而在其它更多群组中可能存在着关注相同话题的人群,却由于群的分属不同而无法看到并参与交流。这种情况对于提高社交软件整体的用户活跃度和提高用户黏性是不利的。
发明内容
本发明为克服现有技术中的不足,提供了一种可提高社交软件整体的用户活跃度和用户满意度的动态群演化生成方法。
为实现上述目的,本发明公开了如下技术方案:
一种动态群演化生成方法,包括如下步骤:
(1)设置动态群条件;
(2)持续监控提取用户发言,并提取发言主题;
(3)根据发言和发言主题生成用户标签;
(4)寻找相同标签用户群,邀请用户加入该动态群;
(5)清退低兴趣度用户;
(6)监控并处理新主题词的提取与替换;
(7)处理结束话题。
进一步的,步骤(1)中所述的动态群条件包括:
1)是否允许生成动态群;
2)动态群人数上限n;
3)是否设置不发言清退提示;
4)主题提取窗口大小w,窗口大小w的单位包括但不局限于语句或发言段落;
5)设置主题提取算法a,算法a包括但不局限于LDA、TF-IDF、SVM、LSA主题抽取方法;
6)提示加入动态群确认的周期p1
7)不发言清退的周期p2
进一步的,动态群可在传统群基础上生成,也可允许用户直接创建动态群并发言,然后等待其他人加入。
进一步的,步骤(2)中所述提取用户发言和主题的方法包括如下步骤:
1)根据提取窗口大小,累计提取w个单位的内容;
2)对累计的文字内容进行自然语言预处理,处理过程包括:分词、词性标注、去停用词;
3)生成以词为元素的特征向量;
4)采用步骤(1)中5)所采取的主题提取算法,提取当前观察内容的主题,表示方式为多个主题词的集合。
进一步的,提取方法可通过加大名词、动词的权重,提高提取主题的精确性。
进一步的,步骤(3)中所述生成用户标签,包括如下步骤:
1)对参与发言的用户进行相关性计算,即计算每个用户发言与每个主题词的关联程度;
2)对于一个用户,当其与某个或某些主题词的相关度大于一定阈值时,则用该主题给用户打上标签;
3)用户的每个标签附加一个权重,权重为用户与主题词的相关性大小;
4)当用户多次被赋予同一个标签时,该标签的多次权重进行累加。
进一步的,步骤(4)中所述的寻找相同标签用户群,邀请用户加入该动态群,包括如下步骤:
1)在一定范围内,从非离线状态的用户中寻找相关用户;
2)基于本次观察所提取的主题词或主题词集合,查找具有相同标签且标签权重大于一定阈值的用户;
3)向查到的用户群发送邀请信息,询问是否要参与本话题;
4)当被邀请用户在期限内确认答复,则该用户直接加入动态群,否则取消对用户的邀请;
5)当加入动态群的用户数达到设置的上限n时,停止邀请新的用户。
进一步的,步骤(5)中所述清退低兴趣度用户,具体方法如下:
对于在观察周期内,持续没有发言的用户,定期询问该用户是否继续停留在本动态群,如果用户在期限内确认答复继续停留,则保留该用户,进入下一轮观察周期,并把观察周期时长增长一倍;如果用户确认退出或限期未答复,则将该用户清退出动态群,清退后如果人数低于限制人数,则继续邀请其他相关用户加入。
进一步的,步骤(6)中所述的监控并处理新主题词的提取与替换,包括如下步骤:
1)动态群被持续地进行主题提取,用新的主题词集合替代旧的主题词集合;
2)当用户间谈话深入进行时会发生主题转移,旧的活跃用户继续参与交流,系统根据用户发言与主题的关联程度,为用户打上新的主题标签;
3)邀请新用户时,按新的主题词进行查找和筛选。
进一步的,步骤(7)中所述处理结束话题,包括如下步骤:
1)当最后一个用户停止发言超过观察周期时,向用户询问是否关闭动态群,用户在确认期限内未答复或确认退出时,则关闭动态群;
2)给每个参与用户发送一份本次交流的主题清单,该清单中的主题按提取时间顺序排列。
本发明公开的一种动态群演化生成方法,具有以下有益效果:
相对于现在互联网社交应用领域中固定的群组管理模式,本发明能够更细粒度地促进用户活跃度,使参与交流的用户具有更高的主题相关度,从而提高社交软件整体的用户活跃度和用户满意度,提高平台的用户黏性。
附图说明
图1是本发明一种动态群演化生成方法的流程图。
具体实施方式
下面结合实施例并参照附图对本发明作进一步描述。
所述的一种动态群演化生成方法,包括如下步骤:
(1)设置动态群条件;
(2)持续监控提取用户发言,并提取发言主题;
(3)根据发言和发言主题生成用户标签;
(4)寻找相同标签用户群,邀请用户加入该动态群;
(5)清退低兴趣度用户;
(6)监控并处理新主题词的提取和替换;
(7)处理结束话题。
其中,步骤(1)所述的动态群条件包括:
1)是否允许生成动态群;
2)动态群人数上限n;
3)是否设置不发言清退提示;
4)主题提取窗口大小w,窗口大小w的单位包括但不局限于语句或发言段落;
5)设置主题提取算法a,算法a包括但不局限于LDA、TF-LDF、SVM、LSA主题抽取方法;
6)提示加入动态群确认的周期p1
7)不发言清退的周期p2
步骤(2)所述提取用户发言和主题的方法包括如下步骤:
1)根据提取窗口大小,累计提取w个单位(如:自然句)的内容;
2)对累计的文字内容进行自然语言预处理,处理过程包括:分词、词性标注、去停用词;
3)生成以词为元素的特征向量;
4)采用步骤(1)中5)所采取的主题提取算法,提取当前观察内容的主题,表示方式为多个主题词的集合。
步骤(3)中所述生成用户标签,包括如下步骤:
1)对参与发言的用户进行相关性计算,即计算每个用户发言与每个主题词的关联程度;
2)对于一个用户,当其与某个或某些主题词的相关度大于一定阈值时,则用该主题给用户打上标签;
3)用户的每个标签附加一个权重,权重为用户与主题词的相关性大小;
4)当用户多次被赋予同一个标签时,该标签的多次权重进行累加。
步骤(4)中所述的寻找相同标签用户群,邀请用户加入该动态群,包括如下步骤:
1)在一定范围内,从非离线状态的用户中寻找相关用户;
2)基于本次观察所提取的主题词或主题词集合,查找具有相同标签且标签权重大于一定阈值的用户;
3)向查到的用户群发送邀请信息,询问是否要参与本话题;
4)当被邀请用户在期限内(如10秒)确认答复,则该用户直接加入动态群,否则取消对用户的邀请;
5)当加入动态群的用户数达到设置的上限n时,停止邀请新的用户。
步骤(8)所述的清退低兴趣度用户,具体方法如下:
对于在观察周期(如5分钟)内,持续没有发言的用户,定期询问该用户是否继续停留在本动态群,如果用户在期限内(如30秒)确认答复继续停留,则保留该用户,进入下一轮观察周期,并把观察周期时常增长一倍(即原来5分钟变为10分钟,原来的1-分钟变为20分钟);如果用户确认退出或限期未答复,则将该用户清退出动态群,清退后如果人数低于限制人数,则继续邀请其他相关用户加入。
步骤(6)中所述的监控并处理新主题词的提取与替换,包括如下步骤:
1)动态群被持续地进行主题提取,用新的主题词集合替代就得主题词集合;
2)当用户间谈话深入进行时会发生主题转移,旧的活跃用户继续参与交流,系统根据用户发言与主题的关联程度,为用户打上新的主题标签;
3)邀请新用户时,按新的主题词进行查找和筛选。
步骤(7)中所述的处理结束话题,包括如下步骤:
1)当最后一个用户停止发言超过观察周期(如5分钟)时,向用户询问是否关闭动态群,用户在确认期限(如30秒)内未答复或确认退出时,则关闭动态群;
2)给每个参与用户(包括中途退出的用户)发送一份本次交流的主题清单,该清单中的主题按提取时间顺序排列。
需要说明的是,动态群可在传统群基础上生成,也可允许用户直接创建动态群并发言,然后等待其他人加入。为了提高提取主题的精确性,步骤(2)中的提取方法可通过加大名词、动词的权重,更加准确的判断并提取主题词。
请参见图1,图1所示为本发明一种动态群演化生成方法的流程图。其中:
交流区,用于承载和显示用户交流内容;
样本收集器,用于定期从交流区采集交流内容,存入内容缓冲区;
内容缓冲区,用于存储要处理的交流内容,含用户和用户发言;
主题提取器,用于将内容缓冲区计算得出的主题词集合存入主题词表;
主题词表,用于存放每次主题提取的结果;
相关度计算器,用于计算用户发言内容与主题的相关性,并根据计算结果给用户打上相应标签,标签记录到用户列表;
用户列表,取自交流区,并记录来自相关度计算器的权重,定期更新到用户总表;
用户总表,记录系统全部用户及其标签;
用户控制器,用于依据主题词表,从用户总表中查找并邀请用户加入交流区,同时用户控制器还负责监控交流区,定期清退低关注度、低参与度的用户。
综上所述,在交流区设置步骤(1)中所述的动态条件;样本收集器、内容缓冲区和主题提取器共同执行步骤(2),持续监控提取用户发言,并提取发言主题;主题词表存放每次主题提取的结果;由相关度计算器执行步骤(3)生成用户标签,记录到用户列表并更新到用户总表;用户控制器监控交流区,执行步骤(4),寻找相同标签用户群,邀请用户加入该动态群;用户控制器同时执行步骤(5),清退低兴趣度用户;主题提取器、相关度计算器共同执行步骤(6),监控并处理新主题词的提取和替换;用户控制器同时执行步骤(7)的话题结束工作。
相对于现在互联网社交应用领域中固定的群组管理模式,本发明能够更细粒度地促进用户活跃度,使参与交流的用户具有更高的主题相关度,从而提高社交软件整体的用户活跃度和用户满意度,提高平台的用户黏性。
以上所述仅是本发明的优选实施方式,应当指出,对于本领域的普通技术人员,在不脱离本发明的前提下,还可以对本发明做出的若干改进和补充,这些改进和补充,也应视为本发明的保护范围。

Claims (10)

1.一种动态群演化生成方法,其特征在于,包括如下步骤:
(1)设置动态群条件;
(2)持续监控提取用户发言,并提取发言主题;
(3)根据发言和发言主题生成用户标签;
(4)寻找相同标签用户群,邀请用户加入该动态群;
(5)清退低兴趣度用户;
(6)监控并处理新主题词的提取与替换;
(7)处理结束话题。
2.根据权利要求1所述的一种动态群演化生成方法,其特征在于,步骤(1)中所述的动态群条件包括:
1)是否允许生成动态群;
2)动态群人数上限n;
3)是否设置不发言清退提示;
4)主题提取窗口大小w,窗口大小w的单位包括但不局限于语句或发言段落;
5)设置主题提取算法a,算法a包括但不局限于LDA、TF-IDF、SVM、LSA主题抽取方法;
6)提示加入动态群确认的周期p1
7)不发言清退的周期p2
3.根据权利要求1所述的一种动态群演化生成方法,其特征在于,动态群可在传统群基础上生成,也可允许用户直接创建动态群并发言,然后等待其他人加入。
4.根据权利要求2所述的一种动态群演化生成方法,其特征在于,步骤(2)中所述提取用户发言和主题的方法包括如下步骤:
1)根据提取窗口大小,累计提取w个单位的内容;
2)对累计的文字内容进行自然语言预处理,处理过程包括:分词、词性标注、去停用词;
3)生成以词为元素的特征向量;
4)采用步骤(1)中5)所采取的主题提取算法,提取当前观察内容的主题,表示方式为多个主题词的集合。
5.根据权利要求4所述的一种动态群演化生成方法,其特征在于,提取方法可通过加大名词、动词的权重,提高提取主题的精确性。
6.根据权利要求4所述的一种动态群演化生成方法,其特征在于,步骤(3)中所述生成用户标签,包括如下步骤:
1)对参与发言的用户进行相关性计算,即计算每个用户发言与每个主题词的关联程度;
2)对于一个用户,当其与某个或某些主题词的相关度大于一定阈值时,则用该主题给用户打上标签;
3)用户的每个标签附加一个权重,权重为用户与主题词的相关性大小;
4)当用户多次被赋予同一个标签时,该标签的多次权重进行累加。
7.根据权利要求6所述的一种动态群演化生成方法,其特征在于,步骤(4)中所述的寻找相同标签用户群,邀请用户加入该动态群,包括如下步骤:
1)在一定范围内,从非离线状态的用户中寻找相关用户;
2)基于本次观察所提取的主题词或主题词集合,查找具有相同标签且标签权重大于一定阈值的用户;
3)向查到的用户群发送邀请信息,询问是否要参与本话题;
4)当被邀请用户在期限内确认答复,则该用户直接加入动态群,否则取消对用户的邀请;
5)当加入动态群的用户数达到设置的上限n时,停止邀请新的用户。
8.根据权利要求7所述的一种动态群演化生成方法,其特征在于,步骤(5)中所述清退低兴趣度用户,具体方法如下:
对于在观察周期内,持续没有发言的用户,定期询问该用户是否继续停留在本动态群,如果用户在期限内确认答复继续停留,则保留该用户,进入下一轮观察周期,并把观察周期时长增长一倍;如果用户确认退出或限期未答复,则将该用户清退出动态群,清退后如果人数低于限制人数,则继续邀请其他相关用户加入。
9.根据权利要求8所述的一种动态群演化生成方法,其特征在于,步骤(6)中所述的监控并处理新主题词的提取与替换,包括如下步骤:
1)动态群被持续地进行主题提取,用新的主题词集合替代旧的主题词集合;
2)当用户间谈话深入进行时会发生主题转移,旧的活跃用户继续参与交流,系统根据用户发言与主题的关联程度,为用户打上新的主题标签;
3)邀请新用户时,按新的主题词进行查找和筛选。
10.根据权利要求9所述的一种动态群演化生成方法,其特征在于,步骤(7)中所述处理结束话题,包括如下步骤:
1)当最后一个用户停止发言超过观察周期时,向用户询问是否关闭动态群,用户在确认期限内未答复或确认退出时,则关闭动态群;
2)给每个参与用户发送一份本次交流的主题清单,该清单中的主题按提取时间顺序排列。
CN201510182467.7A 2015-04-17 2015-04-17 一种动态群演化生成方法 Active CN104731982B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510182467.7A CN104731982B (zh) 2015-04-17 2015-04-17 一种动态群演化生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510182467.7A CN104731982B (zh) 2015-04-17 2015-04-17 一种动态群演化生成方法

Publications (2)

Publication Number Publication Date
CN104731982A true CN104731982A (zh) 2015-06-24
CN104731982B CN104731982B (zh) 2018-01-30

Family

ID=53455868

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510182467.7A Active CN104731982B (zh) 2015-04-17 2015-04-17 一种动态群演化生成方法

Country Status (1)

Country Link
CN (1) CN104731982B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106973007A (zh) * 2017-04-01 2017-07-21 宇龙计算机通信科技(深圳)有限公司 一种即时通讯应用管理方法及系统
CN108257594A (zh) * 2016-12-28 2018-07-06 中国移动通信有限公司研究院 一种会议系统及其信息处理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070168530A1 (en) * 2002-07-11 2007-07-19 Oracle International Corporation Identifying dynamic groups
CN102044009A (zh) * 2009-10-23 2011-05-04 华为技术有限公司 群组推荐方法和系统
CN103430578A (zh) * 2010-10-27 2013-12-04 诺基亚公司 用于标识多个字符串中的对话的方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070168530A1 (en) * 2002-07-11 2007-07-19 Oracle International Corporation Identifying dynamic groups
CN102044009A (zh) * 2009-10-23 2011-05-04 华为技术有限公司 群组推荐方法和系统
CN103430578A (zh) * 2010-10-27 2013-12-04 诺基亚公司 用于标识多个字符串中的对话的方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LUDOVICO BORATTO等: "Group Recommendation with Automatic Identification of Users Communities", 《2009 IEEE/WIC/ACM INTERNATIONAL JOINT CONFERENCE ON WEB INTELLIGENCE AND INTELLIGENT AGENT TECHNOLOGY》 *
何军: "国外群推荐聚集策略研究综述", 《图书情报工作》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108257594A (zh) * 2016-12-28 2018-07-06 中国移动通信有限公司研究院 一种会议系统及其信息处理方法
CN106973007A (zh) * 2017-04-01 2017-07-21 宇龙计算机通信科技(深圳)有限公司 一种即时通讯应用管理方法及系统

Also Published As

Publication number Publication date
CN104731982B (zh) 2018-01-30

Similar Documents

Publication Publication Date Title
Sap et al. Socialiqa: Commonsense reasoning about social interactions
Song et al. Clip models are few-shot learners: Empirical studies on vqa and visual entailment
CN104753985B (zh) 会话列表显示方法和装置
Silk Cooperation without counting: The puzzle of friendship
Akehurst et al. CCR—a content-collaborative reciprocal recommender for online dating
CN111953763A (zh) 一种业务数据推送方法、装置及存储介质
CN102929918B (zh) 虚假网络舆情识别方法
CN106503043B (zh) 一种用于智能机器人的交互数据处理方法
CN105591882A (zh) 一种智能机器人与人混合客服的方法及系统
CN104623898B (zh) 一种进入游戏副本场景的方法和游戏服务器
Toth et al. Predicting Shopping Behavior with Mixture of RNNs.
CN104951953A (zh) 互联网招标投标方法及其系统
CN106572099A (zh) 一种网络游戏的跨服方法和系统
Zheng et al. Sockpuppet detection in online discussion forums
DeLashmutt Church and Climate Change: An Examination of the Attitudes and Practices of Cornish Anglican Churches Regarding the Environment.
Agarwal et al. Application of lexicon based approach in sentiment analysis for short tweets
CN110570215A (zh) 智能客服系统
CN106202031A (zh) 一种基于在线社交平台群聊数据对群成员进行关联的系统及方法
CN104731982A (zh) 一种动态群演化生成方法
TW200923807A (en) Method and system for searching knowledge owner in network community
CN103475659A (zh) 一种基于即时战略游戏的战斗方法及系统
Salisbury et al. Evaluating and Complementing Vision-to-Language Technology for People who are Blind with Conversational Crowdsourcing.
CN116932927B (zh) 基于人工智能实现社交匹配推荐的数据处理方法和装置
CN113420058A (zh) 一种基于结合用户历史行为的对话式学术会议推荐方法
Gupta et al. Suicidal tendency on social media: a case study

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: No.032, no.17-27, No.164 Beiqing Road, Haidian District, Beijing

Patentee after: Beijing Datang Zhichuang Technology Co., Ltd

Address before: 100000, 6 North Yongjia Road, Beijing, 5, building 2, 007, Haidian District

Patentee before: IME (BEIJING) NETWORK TECHNOLOGY Co.,Ltd.

CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 100080 no.2211, 2nd floor, building 4, 75 Suzhou street, Haidian District, Beijing

Patentee after: Beijing Xintang Zhichuang Electronic Technology Co.,Ltd.

Address before: No.032, courtyard 17-27, 164 Beiqing Road, Haidian District, Beijing

Patentee before: Beijing Datang Zhichuang Technology Co., Ltd

CP03 Change of name, title or address