一种动态群演化生成方法
技术领域
本发明涉及互联网应用、社交群管理领域,具体涉及一种动态群演化生成方法。
背景技术
当前的社交类应用软件对于用户社交群管理通常采用一种固定模式,即“创建群—用户加入群---用户在群中交流”。但是,这样模式面临着一个问题是:每个群中的交流实际上是由一个个具体的话题构成,由于群中用户个体间的关注差异,群中话题通常并不具有普适性,因而,往往真正参与交流的人数总是只占群中用户的一小部分,而在其它更多群组中可能存在着关注相同话题的人群,却由于群的分属不同而无法看到并参与交流。这种情况对于提高社交软件整体的用户活跃度和提高用户黏性是不利的。
发明内容
本发明为克服现有技术中的不足,提供了一种可提高社交软件整体的用户活跃度和用户满意度的动态群演化生成方法。
为实现上述目的,本发明公开了如下技术方案:
一种动态群演化生成方法,包括如下步骤:
(1)设置动态群条件;
(2)持续监控提取用户发言,并提取发言主题;
(3)根据发言和发言主题生成用户标签;
(4)寻找相同标签用户群,邀请用户加入该动态群;
(5)清退低兴趣度用户;
(6)监控并处理新主题词的提取与替换;
(7)处理结束话题。
进一步的,步骤(1)中所述的动态群条件包括:
1)是否允许生成动态群;
2)动态群人数上限n;
3)是否设置不发言清退提示;
4)主题提取窗口大小w,窗口大小w的单位包括但不局限于语句或发言段落;
5)设置主题提取算法a,算法a包括但不局限于LDA、TF-IDF、SVM、LSA主题抽取方法;
6)提示加入动态群确认的周期p1;
7)不发言清退的周期p2。
进一步的,动态群可在传统群基础上生成,也可允许用户直接创建动态群并发言,然后等待其他人加入。
进一步的,步骤(2)中所述提取用户发言和主题的方法包括如下步骤:
1)根据提取窗口大小,累计提取w个单位的内容;
2)对累计的文字内容进行自然语言预处理,处理过程包括:分词、词性标注、去停用词;
3)生成以词为元素的特征向量;
4)采用步骤(1)中5)所采取的主题提取算法,提取当前观察内容的主题,表示方式为多个主题词的集合。
进一步的,提取方法可通过加大名词、动词的权重,提高提取主题的精确性。
进一步的,步骤(3)中所述生成用户标签,包括如下步骤:
1)对参与发言的用户进行相关性计算,即计算每个用户发言与每个主题词的关联程度;
2)对于一个用户,当其与某个或某些主题词的相关度大于一定阈值时,则用该主题给用户打上标签;
3)用户的每个标签附加一个权重,权重为用户与主题词的相关性大小;
4)当用户多次被赋予同一个标签时,该标签的多次权重进行累加。
进一步的,步骤(4)中所述的寻找相同标签用户群,邀请用户加入该动态群,包括如下步骤:
1)在一定范围内,从非离线状态的用户中寻找相关用户;
2)基于本次观察所提取的主题词或主题词集合,查找具有相同标签且标签权重大于一定阈值的用户;
3)向查到的用户群发送邀请信息,询问是否要参与本话题;
4)当被邀请用户在期限内确认答复,则该用户直接加入动态群,否则取消对用户的邀请;
5)当加入动态群的用户数达到设置的上限n时,停止邀请新的用户。
进一步的,步骤(5)中所述清退低兴趣度用户,具体方法如下:
对于在观察周期内,持续没有发言的用户,定期询问该用户是否继续停留在本动态群,如果用户在期限内确认答复继续停留,则保留该用户,进入下一轮观察周期,并把观察周期时长增长一倍;如果用户确认退出或限期未答复,则将该用户清退出动态群,清退后如果人数低于限制人数,则继续邀请其他相关用户加入。
进一步的,步骤(6)中所述的监控并处理新主题词的提取与替换,包括如下步骤:
1)动态群被持续地进行主题提取,用新的主题词集合替代旧的主题词集合;
2)当用户间谈话深入进行时会发生主题转移,旧的活跃用户继续参与交流,系统根据用户发言与主题的关联程度,为用户打上新的主题标签;
3)邀请新用户时,按新的主题词进行查找和筛选。
进一步的,步骤(7)中所述处理结束话题,包括如下步骤:
1)当最后一个用户停止发言超过观察周期时,向用户询问是否关闭动态群,用户在确认期限内未答复或确认退出时,则关闭动态群;
2)给每个参与用户发送一份本次交流的主题清单,该清单中的主题按提取时间顺序排列。
本发明公开的一种动态群演化生成方法,具有以下有益效果:
相对于现在互联网社交应用领域中固定的群组管理模式,本发明能够更细粒度地促进用户活跃度,使参与交流的用户具有更高的主题相关度,从而提高社交软件整体的用户活跃度和用户满意度,提高平台的用户黏性。
附图说明
图1是本发明一种动态群演化生成方法的流程图。
具体实施方式
下面结合实施例并参照附图对本发明作进一步描述。
所述的一种动态群演化生成方法,包括如下步骤:
(1)设置动态群条件;
(2)持续监控提取用户发言,并提取发言主题;
(3)根据发言和发言主题生成用户标签;
(4)寻找相同标签用户群,邀请用户加入该动态群;
(5)清退低兴趣度用户;
(6)监控并处理新主题词的提取和替换;
(7)处理结束话题。
其中,步骤(1)所述的动态群条件包括:
1)是否允许生成动态群;
2)动态群人数上限n;
3)是否设置不发言清退提示;
4)主题提取窗口大小w,窗口大小w的单位包括但不局限于语句或发言段落;
5)设置主题提取算法a,算法a包括但不局限于LDA、TF-LDF、SVM、LSA主题抽取方法;
6)提示加入动态群确认的周期p1;
7)不发言清退的周期p2。
步骤(2)所述提取用户发言和主题的方法包括如下步骤:
1)根据提取窗口大小,累计提取w个单位(如:自然句)的内容;
2)对累计的文字内容进行自然语言预处理,处理过程包括:分词、词性标注、去停用词;
3)生成以词为元素的特征向量;
4)采用步骤(1)中5)所采取的主题提取算法,提取当前观察内容的主题,表示方式为多个主题词的集合。
步骤(3)中所述生成用户标签,包括如下步骤:
1)对参与发言的用户进行相关性计算,即计算每个用户发言与每个主题词的关联程度;
2)对于一个用户,当其与某个或某些主题词的相关度大于一定阈值时,则用该主题给用户打上标签;
3)用户的每个标签附加一个权重,权重为用户与主题词的相关性大小;
4)当用户多次被赋予同一个标签时,该标签的多次权重进行累加。
步骤(4)中所述的寻找相同标签用户群,邀请用户加入该动态群,包括如下步骤:
1)在一定范围内,从非离线状态的用户中寻找相关用户;
2)基于本次观察所提取的主题词或主题词集合,查找具有相同标签且标签权重大于一定阈值的用户;
3)向查到的用户群发送邀请信息,询问是否要参与本话题;
4)当被邀请用户在期限内(如10秒)确认答复,则该用户直接加入动态群,否则取消对用户的邀请;
5)当加入动态群的用户数达到设置的上限n时,停止邀请新的用户。
步骤(8)所述的清退低兴趣度用户,具体方法如下:
对于在观察周期(如5分钟)内,持续没有发言的用户,定期询问该用户是否继续停留在本动态群,如果用户在期限内(如30秒)确认答复继续停留,则保留该用户,进入下一轮观察周期,并把观察周期时常增长一倍(即原来5分钟变为10分钟,原来的1-分钟变为20分钟);如果用户确认退出或限期未答复,则将该用户清退出动态群,清退后如果人数低于限制人数,则继续邀请其他相关用户加入。
步骤(6)中所述的监控并处理新主题词的提取与替换,包括如下步骤:
1)动态群被持续地进行主题提取,用新的主题词集合替代就得主题词集合;
2)当用户间谈话深入进行时会发生主题转移,旧的活跃用户继续参与交流,系统根据用户发言与主题的关联程度,为用户打上新的主题标签;
3)邀请新用户时,按新的主题词进行查找和筛选。
步骤(7)中所述的处理结束话题,包括如下步骤:
1)当最后一个用户停止发言超过观察周期(如5分钟)时,向用户询问是否关闭动态群,用户在确认期限(如30秒)内未答复或确认退出时,则关闭动态群;
2)给每个参与用户(包括中途退出的用户)发送一份本次交流的主题清单,该清单中的主题按提取时间顺序排列。
需要说明的是,动态群可在传统群基础上生成,也可允许用户直接创建动态群并发言,然后等待其他人加入。为了提高提取主题的精确性,步骤(2)中的提取方法可通过加大名词、动词的权重,更加准确的判断并提取主题词。
请参见图1,图1所示为本发明一种动态群演化生成方法的流程图。其中:
交流区,用于承载和显示用户交流内容;
样本收集器,用于定期从交流区采集交流内容,存入内容缓冲区;
内容缓冲区,用于存储要处理的交流内容,含用户和用户发言;
主题提取器,用于将内容缓冲区计算得出的主题词集合存入主题词表;
主题词表,用于存放每次主题提取的结果;
相关度计算器,用于计算用户发言内容与主题的相关性,并根据计算结果给用户打上相应标签,标签记录到用户列表;
用户列表,取自交流区,并记录来自相关度计算器的权重,定期更新到用户总表;
用户总表,记录系统全部用户及其标签;
用户控制器,用于依据主题词表,从用户总表中查找并邀请用户加入交流区,同时用户控制器还负责监控交流区,定期清退低关注度、低参与度的用户。
综上所述,在交流区设置步骤(1)中所述的动态条件;样本收集器、内容缓冲区和主题提取器共同执行步骤(2),持续监控提取用户发言,并提取发言主题;主题词表存放每次主题提取的结果;由相关度计算器执行步骤(3)生成用户标签,记录到用户列表并更新到用户总表;用户控制器监控交流区,执行步骤(4),寻找相同标签用户群,邀请用户加入该动态群;用户控制器同时执行步骤(5),清退低兴趣度用户;主题提取器、相关度计算器共同执行步骤(6),监控并处理新主题词的提取和替换;用户控制器同时执行步骤(7)的话题结束工作。
相对于现在互联网社交应用领域中固定的群组管理模式,本发明能够更细粒度地促进用户活跃度,使参与交流的用户具有更高的主题相关度,从而提高社交软件整体的用户活跃度和用户满意度,提高平台的用户黏性。
以上所述仅是本发明的优选实施方式,应当指出,对于本领域的普通技术人员,在不脱离本发明的前提下,还可以对本发明做出的若干改进和补充,这些改进和补充,也应视为本发明的保护范围。