CN110991852A - 一种基于社交媒体大数据的公司形象提升系统架构 - Google Patents

一种基于社交媒体大数据的公司形象提升系统架构 Download PDF

Info

Publication number
CN110991852A
CN110991852A CN201911183426.4A CN201911183426A CN110991852A CN 110991852 A CN110991852 A CN 110991852A CN 201911183426 A CN201911183426 A CN 201911183426A CN 110991852 A CN110991852 A CN 110991852A
Authority
CN
China
Prior art keywords
module
data
social media
model
social
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911183426.4A
Other languages
English (en)
Inventor
于灏
陈冠玮
刘睿
陈睿欣
郑厚清
贾德香
孙艺新
梁鑫
谢清霞
王玓
刘素蔚
王智敏
柳占杰
高洪达
陈�光
刘威
崔维平
王程
李心达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Energy Research Institute Co Ltd
State Grid Beijing Electric Power Co Ltd
Original Assignee
State Grid Energy Research Institute Co Ltd
State Grid Beijing Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Energy Research Institute Co Ltd, State Grid Beijing Electric Power Co Ltd filed Critical State Grid Energy Research Institute Co Ltd
Priority to CN201911183426.4A priority Critical patent/CN110991852A/zh
Publication of CN110991852A publication Critical patent/CN110991852A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于社交媒体大数据的公司形象提升系统架构,包括社会网络模型模块、社交媒体数据提取模块、数据关联匹配模块、用户情感分析与预判模块以及社交媒体数据监测分析处理模块五个模块,所述社会网络模型模块包括多源异构复杂社会网络拓扑图构建模块、关键节点模块、社区识别模块,所述多源异构复杂社会网络拓扑图构建模块包含复杂社会网络用户模型模块与社区识别模块,本发明提供一套基于社交媒体大数据的公司形象提升系统的架构,构造可应用于公司优化社交媒体传播方法渠道,促进构建更加完善的传播格局,提升公司在社交媒体中传播效果,可以进一步促进企业优化社交媒体的传播手段与途径。

Description

一种基于社交媒体大数据的公司形象提升系统架构
技术领域
本发明涉及网络科学技术领域,具体为一种基于社交媒体大数据的公司形象提升系统架构。
背景技术
目前,基于互联网的现代社交网络已经进入飞速发展时期,直至2017年底,各类社交平台的活跃用户数量已达到我国人口的四分之三,使得基于网络平台的社交模式成为社会大众的最主要社交模式之一,同时,基于互联网的社交网络已经成为信息传播的主要方式,也成为信息获取最快速的渠道之一;
较之前的互联网媒体技术,社交媒体记录的数据类型更加丰富、及时,时效性更强,特别地,微博类型的社交媒体数据,成为了信息发布、用户间互动、事件发现扩散的公众平台,作为一种允许公开访问、内容简短、近乎实时、海量规模的典型大数据,微博等社交媒体数据获得了企业界以及学术界的广泛关注,一方面,其精准定位目标客户、互动性强、成本低等特点为企业提供了一种新兴的营销服务模式,另一方面,热点事件在社交媒体网络中具有传播快、影响大的特点,企业可规划设计并大力开拓在社交媒体中的形象传播;
随着社交网络中信息传播模式的变化情况,以及大数据及人工智能技术在具体业务实际中的探索应用,企业形象提升、企业的营销需求分析以及企业社会风险控制等工作的方向和目标逐步向自主性和自发性转变;
良好的公司形象对于任何一家企业的持续发展来说都是必不可少的,一旦出现关于公司的重大社交媒体公众舆论危机、造成负面影响,定会对公司的发展、生产运行、经营管控、客户服务造成不可估量的损失;
所以提供一套基于社交媒体大数据的公司形象提升系统,有利于公司及时了解把控社交媒体舆论风向、社交媒体的用户情绪,并开拓公司优化社交媒体传播方法渠道,促进构建更加完善的传播格局,推动社交网络风险监测与公司业务流、数据流和价值流的有效融合、为客户提供更优质的服务、促进社会公众对公司的更好认知和肯定,进而形成最大的价值认同,对于公司提升品牌影响力和市场竞争力,实现公司新时代的战略发展目标具有重要意义。
发明内容
本发明的目的在于提供一种基于社交媒体大数据的公司形象提升系统架构,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于社交媒体大数据的公司形象提升系统架构,包括社会网络模型模块、社交媒体数据提取模块、数据关联匹配模块、用户情感分析与预判模块以及社交媒体数据监测分析处理模块五个模块构成;
所述社会网络模型模块包括多源异构复杂社会网络拓扑图构建模块、关键节点模块、社区识别模块;
所述多源异构复杂社会网络拓扑图构建模块包含复杂社会网络用户模型模块与社区识别模块;
所述社交网络数据提取模块包括CRF算法模块与规则匹配模块,用于提取有效的社交媒体数据;
所述数据关联匹配模块主要包含业务关键字抽取模块、数据匹配强度训练模块、深度神经网络关联匹配模块,将客户服务数据与社交媒体数据抽取模块构成新的数据服务架构;
所述客户需求预判模块基于数据关联匹配模块的数据服务架构进行客户需求预判;
所述用户情感分析和预判模块主要包含情感极性预测模块与情感分析模块,其中情感极性预测模块又包含文本特征提取模块,情感分析模块包含用户情绪分析模块与群体情绪分析模块;
所述情感极性预测模块与情感分析模块进行关键社区和关键节点获取并构建风险事件识别体系,构建风险识别模块。
优选的,所述社交媒体数据抽取模块通过基于规则的待测数据划分模块、抽取模型建立模块、复杂社会网络用户模型模块实现。
优选的,所述业务关键字抽取模块,由于业务关键字提取的处理结果会作为匹配模型的输入,是后者处理的基本数据单元,故关键字提取准确率及召回率的高低直接影响数据关联的作用结果,结合业务关键字提取是面向特定的数据类型,本模块采用最大熵马尔科夫模型信息抽取技术对关键字进行抽取。
优选的,所述深度神经网络关联匹配模块采用基于统计的中文分词技术对模块的输入文本进行分词,进一步利用词向量技术将单词序列映射为词向量序列。
优选的,所述数据匹配强度训练模块完成关联匹配模型的搭建后,输入具体的业务数据,采用基于Pairwise的learning-to-rank框架、基于hinge损失对整个模型进行训练,根据模型的匹配强度与具体业务数据的匹配标记设置合理的阈值,完成对模型匹配强度阈值的训练。
优选的,所述社交媒体数据监测分析模块模型由多源海量社交媒体数据实时采集模块、异构社交媒体关键信息提取模块与支撑海量社交媒体数据监测处理分析的流计算技术模块三大子模块组成。
优选的,所述多源海量社交媒体数据实时采集模块基于互联网信息采集组件,是指将采集组件中的采集器模块、协调器模块和抓取器模块都独立设计为进程,支持在不同的服务器混合部署。
优选的,所述风险识别模块针对复杂社会风险缓解策略本身比较难,超出了机器模型的能力范围,为业务人员提供支持,由业务人员制定风险环节策略,在数据量累计足够之后,根据风险事件的特点去对缓解策略进行评估排序。
与现有技术相比,本发明的有益效果是:本发明技术方案以公司的具体业务场景和需求以及社交媒体上数据的具体特点为基础,构建综合的社会网络模型模块,为整个系统研究提供基本的数据数据服务,构建复杂社会网络的节点模型和有向边模型,形成复杂社会网络模型,在此基础上进行复杂社交网络的关键节点识别和社区识别,为社交媒体上信息传播的研究提供基础;同时基于社会网络模型模块的社会关系拓扑图,利用社交网络数据提取模块的文本关键字提取方法提取数据,提供给数据关联匹配模块,进行公司客户服务数据和复杂社交网络数据的融合关联,构建数据融合体系架构;通过结合公司相关数据,构建客户需求预测模型以及用户情感分析和预判模块,为公司客服、公关以及舆情监测、风险预测等应用提供支持。最后根据前面模块的工作搭建社交媒体数据监测分析模块,进行实际的应用操作,提供一套基于社交媒体大数据的公司形象提升系统的架构,构造可应用于公司优化社交媒体传播方法渠道,促进构建更加完善的传播格局,提升公司在社交媒体中传播效果,可以进一步促进企业优化社交媒体的传播手段与途径,树立企业品牌,建立良好社会形象;将构造成功的社交媒体数据模型用于预判客户需求、精准定位社会风险等客户服务场景中,提高公司智能化客户服务水平;促进社会风险主动式闭环监测的实现,降低企业社会风险,满足新媒体时代海量舆情高效监测的需求,有效防范和消除公司潜在的社会风险。
附图说明
图1为本发明的整体系统框图;
图2为本发明的复杂社会网络模型模块框图;
图3为本发明的数据关联匹配模块框图;
图4为本发明的社交媒体数据提取模块框图;
图5为本发明的深度神经网络关联匹配模块框图;
图6为本发明的户情感分析和预判模块框图;
图7为本发明的社交媒体数据监测分析模块框图;
图8为本发明的多源海量社交媒体数据实时采集模块框图;
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1至图8,本发明提供一种技术方案:一种基于社交媒体大数据的公司形象提升系统架构,包括社会网络模型模块、社交媒体数据提取模块、数据关联匹配模块、用户情感分析与预判模块以及社交媒体数据监测分析处理模块五个模块构成,所述社会网络模型模块包括多源异构复杂社会网络拓扑图构建模块、关键节点模块、社区识别模块,所述多源异构复杂社会网络拓扑图构建模块包含复杂社会网络用户模型模块与社区识别模块,所述社交网络数据提取模块包括CRF算法模块与规则匹配模块,用于提取有效的社交媒体数据,所述数据关联匹配模块主要包含业务关键字抽取模块、数据匹配强度训练模块、深度神经网络关联匹配模块,将客户服务数据与社交媒体数据抽取模块构成新的数据服务架构,所述客户需求预判模块基于数据关联匹配模块的数据服务架构进行客户需求预判,所述用户情感分析和预判模块主要包含情感极性预测模块与情感分析模块,其中情感极性预测模块又包含文本特征提取模块,情感分析模块包含用户情绪分析模块与群体情绪分析模块,所述情感极性预测模块与情感分析模块进行关键社区和关键节点获取并构建风险事件识别体系,构建风险识别模块,所述社交媒体数据监测分析模块模型由多源海量社交媒体数据实时采集模块、异构社交媒体关键信息提取模块与支撑海量社交媒体数据监测处理分析的流计算技术模块三大子模块组成;
如图2所示,复杂社会网络模型模块:本模块对社交媒体上的相关数据进行高效采集,在采集得到的数据基础之上构建复杂社会网络用户模型,同时对用户之间的特定关系建模,构建用户之间的单向边模型,综合得到复杂社会网络拓扑结构模型。并以复杂社会网络拓扑结构模型为对象,识别其上的关键节点和可能存在的潜在社区。子模块技术主要解决复杂社会网络用户模型和有向边模型的构建、社区发现和划分和关键节点识别;
如图2所示,构建复杂社会网络用户模型模块:基于最小二乘法的支持向量机,对用户数据进行采样并进行预处理构造周期性训练样本数据,进行归一化处理,同时选取核函数与参数构造最小二乘支持向量机预测模型,并利用此向量机预测模型完成缺失用户数据的预测同时引入用户的行为数据特征,通过更多信息的引入来提升模型预测的准确度,对缺失的属性数据进行预测补全。并通过用户画像技术对用户的社会属性、兴趣爱好、性格特点和行为习惯等数据进行定性+定量画像标签建模;
如图2所示,构建用户间关系模型模块:在构建社会网络拓扑图时根据交互数据,采用传统机器学习的方式对用户之间的关系自动进行预测,从而构建用户之间的单向边模型,在关键节点识别方法中引入节点/社区间单向影响力模型;
如图2所示,构建多源异构复杂社会网络拓扑图模块:针对社交媒体上用户关系复杂多样的特点,可以通过人工构建规则的方式对用户之间的简单关系进行抽取,对于复杂的潜在用户关系,根据用户基本属性数据和交互行为数据,采用监督学习模型进行预测,构建完成的用户之间关系模型,再与复杂社会网络用户模型关联得到复杂社会网络拓扑图。
如图2所示,社区识别模块:针对复杂社交网络庞大的特点,采用标签传播算法(LPA),从已标记的节点的标签信息来预测未标记的节点的标签信息,利用样本间的关系,以接近线性的时间识别网络中可能存在的社区,并且结果的准确度可接受,实现高效的社区发现;
如图2所示,关键节点识别模块:复杂社交网络上除了用户之间的基本关系构成的网络结构,信息在社交网络上传播也构成网络结构,本项目拟对这两种网络结构计算节点的重要度,并综合得到结果。同时,考虑到网络结构中节点的重要程度计算方式多样以及模型融合在学术和工业界表现出的良好效果,本项目拟采用多种计算方式计算节点的重要度,在用模型融合的方式对多个重要度进行融合;
如图4所示,社交媒体数据提取模块:本模块基于机器学习技术、结合条件随机场序列标注与专家规则相结合的非结构化文本关键信息提取模型,能够自动化地通过算法对模式进行归纳(形成“抽取模型”),对于当今社交媒体这种没有明显模式、人工很难观察到特定规则的关键信息的抽取具有较强的抽取能力;采用经典序列标注的同时,本模块技术路线引入了“规则方法”,这样就避免了现有技术中,事先准备较多的人工标注语料、抽取效果不稳定、准确性难以预估的问题,提升技术的通用性和效果稳定性,提取出有效的社交媒体数据,为数据关联匹配模块提供数据服务;基于规则的待测数据划分模块:基于规则对待测数据划分。通过专家编写的少量正则表达式对待测样本语料进行抽取,得到少数符合规则的文本语料;抽取模型建立模块:基于条件随机场模型以及迭代尺度法算法对“模式自动归纳”抽取模型进行训练,得到待测试模型;杂社会网络用户模型模块基于负反馈思想,对待测试模型进行测试,若正确率达标则可直接投入使用;若正确率不达标则需要由专家继续编写少量正则,完善规则,返回模块一进行循环操作;
如图3与图5所示,数据关联匹配模块:本模块首先根据公司客户服务数据和模块二提取的社交媒体数据,采用Neural IR的方式对数据进行匹配关联(业务关键字抽取和数据匹配强度训练),通过深度神经网络可以将离散数据转换为语义表示的特点,统一处理异构多态的数据。并根据用户行为数据模型,对公司的客户需求和公司相关的风险事件进行判定,构建用户需求预测模型和用户情绪判别模型,为公司的客户服务和舆情监测提供帮助;
业务关键字抽取模块:由于业务关键字提取的处理结果会作为匹配模型的输入,是后者处理的基本数据单元,故关键字提取准确率及召回率的高低直接影响数据关联的作用结果,结合业务关键字提取是面向特定的数据类型,本模块采用最大熵马尔科夫模型信息抽取技术对关键字进行抽取;深度神经网络关联匹配模块:采用基于统计的中文分词技术对模块的输入文本进行分词,进一步利用词向量技术将单词序列映射为词向量序列;对于给定的两段待匹配数据,经映射得到词向量序列后,对其做归一化处理,并采用余弦相似度的计算方式计算单词两两之间的相似度,构建相似度矩阵;得到两段文本的相似度矩阵之后,借鉴DRMM模型,采用卷积神经网络从原始相似度矩阵提取高层次的匹配特征。在高层次特征的基础之上,应用多层感知机对抽取的特征进行映射,将其变换为匹配评分;数据匹配强度训练模块:完成关联匹配模型的搭建后,输入具体的业务数据,采用基于Pairwise的learning-to-rank框架、基于hinge损失对整个模型进行训练,根据模型的匹配强度与具体业务数据的匹配标记设置合理的阈值,完成对模型匹配强度阈值的训练客户需求预判模块:面向社交媒体数据的相关业务类型判别,1.针对社交媒体上数据异构多态的、特征工程复杂的特点,拟采取在业务专家的帮助下通过复杂特征工程加传统监督学习模型的方式对社交媒体数据的相关业务类型判别,在传统模型的指导下,构建深度神经网络模型对业务类型进行判别,减少特征工程的依赖,提升业务判别的准确性;2.用户需求判定方法,针对社交媒体数据异构多态的数据特点,以及业务相关数据的引入做相关优化,利用特征工程等方式充分利用数据的信息,实现用户需求判定;
如图6所示,用户情感分析和预判模块:将综合利用基于传统机器学习的情感分析技术和深度学习模型来进行预测分析,解决机器理解文本深层意思、预测效率和精准度的问题。本方案通过对文本大数据进行深入挖掘,实现强化客户需求管理、探究客户情绪、优化客户服务体系等目的,同时说明识别社交网络中潜在的风险事件的方法,结合复杂社交网络模型,分析热点事件的传播的特点,构建系统的抑制风险事件的解决方案,通过主动服务、预先公关等手段中断可能的传播路径上的关键节点或者综合影响力较大的节点,为公司提供了在负面事件大规模蔓延之前阻止负面事件一步发展的可能,更好地维护公司的公众形象;(1)情感极性预测模块:考虑到社交媒体上的数据大多是短文本数据,因此主要采用短文本情感分析技术,长文本和中长文本情感分析技术作为辅助。在模型方面,以深度学习情感分析技术为主,以基于传统监督学习的情感技术为辅,其中文本分长文本,中长文本,短文本;(2)情感情绪分析模块:①用户情绪分析,用户情绪的分析偏向个人化,用以上提到的情感极性分析技术对用户个人文本信息和个人属性数据,例如个人喜好、性别、职业等等,还有网上留下的种种信息记录,比如上网时间短,上网时长等等,来进行分析;②群体情感分析,针对复杂社交网络拓扑结构的结构特点,本项目拟采用用户情感分析模型对用户节点的情感极性进行判别,在社区的基础之上采用投票或Stacking的方式对社区的情感极性进行判别;同时,在不考虑社区的基础上,在社交网络结构上运行图联通算法检测用户情感极性的传播范围;(3)风险识别模块:针对复杂社会风险缓解策略本身比较难,超出了机器模型的能力范围,本方案为业务人员提供支持,由业务人员制定风险环节策略,在数据量累计足够之后,根据风险事件的特点去对缓解策略进行评估排序,看作一个推荐的问题,最终反馈给业务人员,作为业务人员的辅助,进一步提升效率;
如图7与图8所示,数据监测分析模块模型:在技术方面主要解决多源异构社交网络数据及内部客户服务数据的采集、监测提取、融合建模、关联分析及实时流数据计算的这个过程,主要由多源海量社交媒体数据实时采集模块、异构社交媒体关键信息提取模块与支撑海量社交媒体数据监测处理分析的流计算技术模块三大子模块组成,完成面向客服水平提升的客服需求分析、潜在情绪预判;对社交媒体中新闻传播结果进行监测分析,完成社交媒体传播策略制定有效性的验证,最终提炼出公司基于社交媒体大数据的形象提升路径;
多源海量社交媒体数据实时采集模块:本发明的基于互联网信息采集组件,是指将采集组件中的采集器模块、协调器模块和抓取器模块都独立设计为进程,支持在不同的服务器混合部署。同时,采用Apache Zookeeper作为微服务架构负载均衡和服务协调的统一协调器,实现全局的客户端、微服务请求分发及协调架构,从而在试点验证的社交媒体信息采集过程中,无论是采集能力不足还是抓取能力不足,均可以增加对应的组件副本,实现整体的弹性扩容;
支持弹性扩容的社交媒体信息采集架构设计:如图8所示,在上述三个步骤的交互过程中,抓取服务(Fetcher)和信息提取服务(Processor)不存在直接依赖,而统一通过分布式协调服务获取对方地址,从而,可以实现在不同服务器部署多个Processor,实现高可用,并且在Processor性能不足时,可以通过在其它服务器增补部署,实现性能水平提升;
异构社交媒体关键信息提取模块:在采用经典序列标注的同时,本模块引入了通过“规则方法”,为序列标注算法提供初始的驱动语料,并将整个过程进行标准化工程定义,以避免事先准备较多的人工标注语料、抽取效果不稳定、准确性难以预估的问题,提升技术的通用性和效果稳定性;支撑海量社交媒体数据监测处理分析的流计算技术模块:设计一套面向传播信息处理及传播指标计算的流计算架构,实现传播数据的实时获取处理及传播指标的实时计算,基于Hadoop/Spark开源大数据平台软件进行定制优化,构建满足社交媒体大数据全生命周期的存储、流转及计算的完整体系,为进行实际项目验证提供整体的基础平台级支撑。
本发明主要针对一种基于社交媒体大数据的公司形象提升系统架构,本发明技术方案以公司的具体业务场景和需求以及社交媒体上数据的具体特点为基础,构建综合的社会网络模型模块,为整个系统研究提供基本的数据数据服务,构建复杂社会网络的节点模型和有向边模型,形成复杂社会网络模型,在此基础上进行复杂社交网络的关键节点识别和社区识别,为社交媒体上信息传播的研究提供基础;同时基于社会网络模型模块的社会关系拓扑图,利用社交网络数据提取模块的文本关键字提取方法提取数据,提供给数据关联匹配模块,进行公司客户服务数据和复杂社交网络数据的融合关联,构建数据融合体系架构;通过结合公司相关数据,构建客户需求预测模型以及用户情感分析和预判模块,为公司客服、公关以及舆情监测、风险预测等应用提供支持。最后根据前面模块的工作搭建社交媒体数据监测分析模块,进行实际的应用操作,提供一套基于社交媒体大数据的公司形象提升系统的架构,构造可应用于公司优化社交媒体传播方法渠道,促进构建更加完善的传播格局,提升公司在社交媒体中传播效果,可以进一步促进企业优化社交媒体的传播手段与途径,树立企业品牌,建立良好社会形象;将构造成功的社交媒体数据模型用于预判客户需求、精准定位社会风险等客户服务场景中,提高公司智能化客户服务水平;促进社会风险主动式闭环监测的实现,降低企业社会风险,满足新媒体时代海量舆情高效监测的需求,有效防范和消除公司潜在的社会风险。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (8)

1.一种基于社交媒体大数据的公司形象提升系统架构,其特征在于:包括社会网络模型模块、社交媒体数据提取模块、数据关联匹配模块、用户情感分析与预判模块以及社交媒体数据监测分析处理模块五个模块;
所述社会网络模型模块包括多源异构复杂社会网络拓扑图构建模块、关键节点模块、社区识别模块;
所述多源异构复杂社会网络拓扑图构建模块包含复杂社会网络用户模型模块与社区识别模块;
所述社交网络数据提取模块包括CRF算法模块与规则匹配模块,用于提取有效的社交媒体数据;
所述数据关联匹配模块主要包含业务关键字抽取模块、数据匹配强度训练模块、深度神经网络关联匹配模块,将客户服务数据与社交媒体数据抽取模块构成新的数据服务架构;
所述客户需求预判模块基于数据关联匹配模块的数据服务架构进行客户需求预判;
所述用户情感分析和预判模块主要包含情感极性预测模块与情感分析模块,其中情感极性预测模块又包含文本特征提取模块,情感分析模块包含用户情绪分析模块与群体情绪分析模块;
所述情感极性预测模块与情感分析模块进行关键社区和关键节点获取并构建风险事件识别体系,构建风险识别模块。
2.根据权利要求1所述的一种基于社交媒体大数据的公司形象提升系统架构,其特征在于:所述社交媒体数据抽取模块通过基于规则的待测数据划分模块、抽取模型建立模块、复杂社会网络用户模型模块实现。
3.根据权利要求1所述的一种基于社交媒体大数据的公司形象提升系统架构,其特征在于:所述业务关键字抽取模块,由于业务关键字提取的处理结果会作为匹配模型的输入,是后者处理的基本数据单元,故关键字提取准确率及召回率的高低直接影响数据关联的作用结果,结合业务关键字提取是面向特定的数据类型,本模块采用最大熵马尔科夫模型信息抽取技术对关键字进行抽取。
4.根据权利要求1所述的一种基于社交媒体大数据的公司形象提升系统架构,其特征在于:所述深度神经网络关联匹配模块采用基于统计的中文分词技术对模块的输入文本进行分词,进一步利用词向量技术将单词序列映射为词向量序列。
5.根据权利要求1所述的一种基于社交媒体大数据的公司形象提升系统架构,其特征在于:所述数据匹配强度训练模块完成关联匹配模型的搭建后,输入具体的业务数据,采用基于Pairwise的learning-to-rank框架、基于hinge损失对整个模型进行训练,根据模型的匹配强度与具体业务数据的匹配标记设置合理的阈值,完成对模型匹配强度阈值的训练。
6.根据权利要求1所述的一种基于社交媒体大数据的公司形象提升系统架构,其特征在于:所述社交媒体数据监测分析模块模型由多源海量社交媒体数据实时采集模块、异构社交媒体关键信息提取模块与支撑海量社交媒体数据监测处理分析的流计算技术模块三大子模块组成。
7.根据权利要求6所述的一种基于社交媒体大数据的公司形象提升系统架构,其特征在于:所述多源海量社交媒体数据实时采集模块基于互联网信息采集组件,是指将采集组件中的采集器模块、协调器模块和抓取器模块都独立设计为进程,支持在不同的服务器混合部署。
8.根据权利要求1所述的一种基于社交媒体大数据的公司形象提升系统架构,其特征在于:所述风险识别模块针对复杂社会风险缓解策略本身比较难,超出了机器模型的能力范围,为业务人员提供支持,由业务人员制定风险环节策略,在数据量累计足够之后,根据风险事件的特点去对缓解策略进行评估排序。
CN201911183426.4A 2019-11-27 2019-11-27 一种基于社交媒体大数据的公司形象提升系统架构 Pending CN110991852A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911183426.4A CN110991852A (zh) 2019-11-27 2019-11-27 一种基于社交媒体大数据的公司形象提升系统架构

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911183426.4A CN110991852A (zh) 2019-11-27 2019-11-27 一种基于社交媒体大数据的公司形象提升系统架构

Publications (1)

Publication Number Publication Date
CN110991852A true CN110991852A (zh) 2020-04-10

Family

ID=70087418

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911183426.4A Pending CN110991852A (zh) 2019-11-27 2019-11-27 一种基于社交媒体大数据的公司形象提升系统架构

Country Status (1)

Country Link
CN (1) CN110991852A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115865708A (zh) * 2023-02-14 2023-03-28 国家计算机网络与信息安全管理中心江苏分中心 一种基于sir-d模型的复杂社交网络信息处置方法
WO2024098516A1 (zh) * 2022-11-07 2024-05-16 中电科大数据研究院有限公司 一种社交网络关键节点挖掘的方法、装置及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559207A (zh) * 2013-10-10 2014-02-05 江苏名通信息科技有限公司 一种基于社交媒体计算的金融行为分析系统
KR20150046793A (ko) * 2013-10-21 2015-05-04 대한민국(국민안전처 국립재난안전연구원장) 소셜미디어를 이용한 재난 감지 시스템
CN109522460A (zh) * 2018-08-30 2019-03-26 中国电子进出口有限公司 一种基于社交网络社团划分的舆情监测方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559207A (zh) * 2013-10-10 2014-02-05 江苏名通信息科技有限公司 一种基于社交媒体计算的金融行为分析系统
KR20150046793A (ko) * 2013-10-21 2015-05-04 대한민국(국민안전처 국립재난안전연구원장) 소셜미디어를 이용한 재난 감지 시스템
CN109522460A (zh) * 2018-08-30 2019-03-26 中国电子进出口有限公司 一种基于社交网络社团划分的舆情监测方法及系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
刘斌: "基于大数据分析和复杂事件处理的金融信息服务平台", 《计算机系统应用》 *
尹兰等: "基于关键词图的社交话题抽取及情感极性判别", 《贵州师范大学学报(自然科学版)》 *
程耀东等: "基于媒体大数据的智能服务平台技术研究", 《现代电视技术》 *
陈媛: "大数据技术", 《大数据与社会网络》 *
齐慧颖: "医学信息资源知识表示", 《医学信息资源智能管理》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024098516A1 (zh) * 2022-11-07 2024-05-16 中电科大数据研究院有限公司 一种社交网络关键节点挖掘的方法、装置及存储介质
CN115865708A (zh) * 2023-02-14 2023-03-28 国家计算机网络与信息安全管理中心江苏分中心 一种基于sir-d模型的复杂社交网络信息处置方法

Similar Documents

Publication Publication Date Title
CN108804521B (zh) 一种基于知识图谱的问答方法及农业百科问答系统
CN112199608B (zh) 基于网络信息传播图建模的社交媒体谣言检测方法
CN104834668B (zh) 基于知识库的职位推荐系统
CN111885399B (zh) 内容分发方法、装置、电子设备以及存储介质
CN108304867B (zh) 面向社交网络的信息流行度预测方法及系统
CN105808590B (zh) 搜索引擎实现方法、搜索方法以及装置
CN117271767A (zh) 基于多智能体的运维知识库的建立方法
CN113254630B (zh) 一种面向全球综合观测成果的领域知识图谱推荐方法
CN113779195B (zh) 热点事件状态评估方法
CN109408574B (zh) 基于文本挖掘技术的投诉责任认定系统
CN112165639B (zh) 内容分发方法、装置、电子设备以及存储介质
CN104484359A (zh) 一种基于社交图谱的舆情分析方法及装置
Guo et al. A survey of Internet public opinion mining
CN110991852A (zh) 一种基于社交媒体大数据的公司形象提升系统架构
CN113723853A (zh) 岗位胜任力需求数据处理方法及装置
CN114003803B (zh) 一种社交平台上特定地域的媒体账号发现方法及系统
Dong Exploration on web usage mining and its application
Cheng et al. Quickly locating POIs in large datasets from descriptions based on improved address matching and compact qualitative representations
CN114637903A (zh) 一种针对定向目标数据拓展的舆情数据采集系统
CN111984874B (zh) 一种融合情感计算和网络众包的并行推荐方法
CN115131052A (zh) 一种数据处理方法、计算机设备和存储介质
Zhao et al. Online distance learning precision service technology based on big data analysis
CN106407271B (zh) 一种智能客服系统及其智能客服知识库的更新方法
CN115659060A (zh) 一种基于动态图神经网络的信息推荐方法及系统
CN113742495A (zh) 基于预测模型的评级特征权重确定方法及装置、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200410

RJ01 Rejection of invention patent application after publication