CN111914141A - 一种舆情知识库构建方法及舆情知识库 - Google Patents

一种舆情知识库构建方法及舆情知识库 Download PDF

Info

Publication number
CN111914141A
CN111914141A CN202010752163.0A CN202010752163A CN111914141A CN 111914141 A CN111914141 A CN 111914141A CN 202010752163 A CN202010752163 A CN 202010752163A CN 111914141 A CN111914141 A CN 111914141A
Authority
CN
China
Prior art keywords
public opinion
event
public
knowledge base
case
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010752163.0A
Other languages
English (en)
Other versions
CN111914141B (zh
Inventor
黄涛
程朴
何莹
龚勋
万忠平
梁少勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou China Dci Co ltd
Original Assignee
Guangzhou China Dci Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou China Dci Co ltd filed Critical Guangzhou China Dci Co ltd
Priority to CN202010752163.0A priority Critical patent/CN111914141B/zh
Publication of CN111914141A publication Critical patent/CN111914141A/zh
Application granted granted Critical
Publication of CN111914141B publication Critical patent/CN111914141B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种舆情知识库构建方法及舆情知识库,舆情知识库构建方法包括:采集历史舆情控制案例;根据历史舆情控制案例生成事件对象,事件对象包括事件标识、开始时间、结束时间、事件主题、事件关键词、事件简介;将事件对象存储为舆情案例库。本发明将历史舆情控制案例生成事件对象,由多个事件对象构建舆情案例库,可以便于对各个舆情案例的关联分析、与当前处理的舆情案件进行智能匹配,辅助有关组织或机构进行舆情的监管。

Description

一种舆情知识库构建方法及舆情知识库
技术领域
本发明涉及数据挖掘与分析技术领域,更具体地,涉及一种舆情知识库构建方法及舆情知识库。
背景技术
在社会舆情应用与决策技术中,“情景—应对”型应急管理模式已在学术界形成共识,并通过理论与技术的不断完善,向政府和产业界推行,逐步确立突发事件“情景—应对”型应急管理的新模式。突发事件“情景—应对”型应急管理具体是:首先需要对物理和社会空间的突发事件进行实时而全面的监控与智能分析,从海量,分散,非结构化,实时变化的灾情数据中挖掘出有价值的情报,通过分析获取当前态势的总体描述,进行态势推演,而后进行综合研判和决策,及时将相关信息提供给最需要的人,使决策者做出恰如其分的现场处置与应急部署。
当前地方政府所建立的情报信息处理和预测预警技术体系也是社会舆情决策分析的一部分,例如:反恐怖情报信息研判例会;紧急信访信息监测处理制度;水、雨情信息采集、通讯、预报及调度系统;突发公共卫生事件监测与预警系统;社会治安的动态监控、分析和预警等等。但这些技术体系不完善,有些管理部门的思想观念跟不上形势需要;有些是管理机制还不够健全,职能交叉重叠,信息资源共享程度低;信息情报网络动态反映滞后等问题,舆情评估机制无法做出全面系统客观的评估。
随着互联网的飞速发展与普及,人们已经习惯于通过网络对社会热点、社会公共事务等发表各自的意见或言论,各种形式的网络媒体也纷纷涌现,如公众号、微博等等。社会事件和社会问题产生之时,民众往往迅速借助网络媒体平台,了解到事件的起因与发展过程,进而通过网络媒体发表意见,这些意见对于事件的发展产生着不容忽视的影响,由此产生了网络舆情。由于网络传播的快速性、广泛性和强互动性,网络舆情往往呈爆发式增长,且形式纷繁复杂,所以需要合理地对网络舆情大数据进行挖掘,为网络舆情的实时有效监管提供强有力的手段。
发明内容
本发明旨在克服上述现有技术的至少一种缺陷(不足),提供一种舆情知识库构建方法及舆情知识库,用于解决缺乏对网络舆情有力监管工具的问题。
本发明采取的技术方案是:
一种舆情知识库构建方法,包括:采集历史舆情控制案例;根据历史舆情控制案例生成事件对象,事件对象包括事件标识、开始时间、结束时间、事件主题、事件关键词、事件简介;将事件对象存储为舆情案例库。
在舆情案例库构建过程中,引入面向对象技术将历史舆情控制案例模型化为对象,并作为舆情案例库中的一个独立知识单元,能在关系数据库的基础上进行更复杂的知识表示和知识推理。构建舆情案例库可以形成系统的案例经验,作为同类型案例的借鉴,指导当前的舆情控制。舆论案例库可以提供案例的描述,便于相关案例的关联和纵向分析,可以增强对相似舆情事件的认知和理解,有助于相关机构或组织在面临新的舆情事件时,能够进行更加精确的推断和预测,作为一个强有力的舆论监管工具。
进一步地,将历史舆情控制案例存储为舆情案例库,包括:提取历史舆情控制案例中每个句子的施事词汇、受事词汇、地点词汇和谓词;当施事词汇或受事词汇属于同一类舆情人物词库,且施事词汇或受事词汇或谓词属于同一类舆情事件词库,则将历史舆情控制案例所对应生成的事件对象分类为同一类;或者,当地点词汇属于同一类舆情地点词库,且施事词汇或受事词汇或谓词属于同一类舆情事件词库,则将历史舆情控制案例所对应生成的事件对象分类为同一类;将分类后的历史舆情控制案例分类存储为舆情案例库。
分类好的事件对象,可以在构建舆情案例库时进行分类存储,便于后续对事件对象的分类调用和分析。“事件”往往会以形容词的形式出现在施事词汇或受事词汇中或以动词的形式出现在谓词当中。“人物”多数出现在施事词汇或受事词汇中,“地点”只会出现在地点词汇中,通过人物+事件或地点+事件进行案例类型判别的方法,考虑到了关键词在语句中的位置,避免盲目词汇匹配造成的错误判断,降低了舆情类别误判的概率。
进一步地,在提取历史舆情控制案例中每个句子的施事词汇、受事词汇、地点词汇和谓词之后,还包括:将所提取的施事词汇、受事词汇、地点词汇和谓词标注为关键词;将关键词与实体敏感库中的词汇进行匹配,将与实体敏感库中的词汇相匹配的关键词标注为舆情关键词。
舆情关键词是舆情文本的主干,代表着文本内容的主题,舆情预估也需要以舆情关键词为核心。与实体敏感库进行匹配,所匹配得到的词汇作为舆情关键词,可以便于后续对历史舆情控制案例的进一步分析以及案例相似性、关联性分析等。
进一步地,所述舆情知识库构建方法还包括:建立舆情主题;根据舆情主题生成多级主题对象,主题对象包括主题级别和主题名称;将主题对象存储为舆情主题库。
舆情主题库是关于舆情内容所属主题的知识库,每个主题对象作为舆情主题库中的一个独立知识单元,建立主题库有利于对舆情事件实施归类,从而可以有针对性地掌握舆情状况。多级的主题对象,可以呈现层次化结构,层次越高主题类别粒度越粗。
进一步地,所述舆情知识库构建方法还包括:建立以传播扩散性、民众关注度、内容敏感性和态度倾向性作为一级评估指标的多级评估指标;根据评估指标生成评估指标对象,评估指标对象包括指标级别和指标名称;将评估指标对象存储为舆情评估指标库。
舆情评估指标库是评估舆情态势的知识库,每个评估指标对象作为舆情评估指标库中的一个独立知识单元,一级评估指标下可以对应有二级评估指标、三级评估指标等。多级评估指标可以呈现层次化结构。4个一级评估指标传播扩散性、民众关注度、内容敏感性和态度倾向性,是根据舆情本身的性质和特点以及舆情演化的规律和条件所设置的。在进行舆情评估时,可以运用舆情评估指标库中的各项评估指标对象对当前舆情事件进行全面评估。
进一步地,所述舆情知识库构建方法还包括:根据评估指标的一个或多个建立预警等级;根据预警等级生成预警等级对象,预警等级对象包括等级编号、等级名称、标示颜色和判断标准;将预警等级对象存储为舆情预警等级库。
舆情预警等级库是关于舆情事件预警响应级别的知识库,每个预警等级对象作为舆情预警等级库的一个独立知识单元,可以快速辅助危机预警并引导决策。
进一步地,所述舆情知识库构建方法还包括:根据不同对象类别和/或不同时空信息和/或不同评估指标和/或不同预警等级制定不同的响应策略;将响应策略存储为舆情处置策略库。
舆情处置策略库是关于舆情事件处置策略的知识库,每个响应策略作为舆情处置策略库的一个独立知识单元。根据不同对象类别、不同时空信息、不同评估指标、不同预警等级制定不同的响应策略,使得响应策略对应不同的舆情主题、类别、发生位置、发展阶段、预警等级等,为当前舆情事件的决策提供参考。
进一步地,事件对象还包括最高预警等级和/或事件响应策略。
事件对象中的最高预警等级和事件响应策略可以为相关机构或组织在面对新的舆情事件要进行决策时,可以浏览舆情案例库中的时间对象以获得相似时间的处置决策方法。
一种舆情知识库,包括如上所述的舆情知识库构建方法所构建的舆情案例库。
一种舆情知识库,包括如上所述的舆情知识库构建方法所构建的舆情案例库,以及舆情主题库和/或舆情评估指标库和/或舆情预警等级库和/或舆情处置策略库。
与现有技术相比,本发明的有益效果至少为:将历史舆情控制案例生成事件对象,由多个事件对象构建舆情案例库,可以便于对各个舆情案例的关联分析、与当前处理的舆情案件进行智能匹配,辅助有关组织或机构进行舆情的监管。
附图说明
图1为本发明实施例的舆情案例库构建方法示意图。
图2为本发明实施例的另一个舆情案例库构建方法示意图
图3为本发明实施例的舆情主题库构建方法示意图。
图4为本发明实施例的舆情评估指标库构建方法示意图。
图5为本发明实施例的舆情预警等级库构建方法示意图。
图6为本发明实施例的舆情处置策略库构建方法示意图。
图7为本发明实施例的舆情知识库示意图。
具体实施方式
本发明附图仅用于示例性说明,不能理解为对本发明的限制。为了更好说明以下实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
实施例1
如图1所示,本实施例提供一种舆情知识库构建方法,可以包括舆情案例库的构建步骤:
A1.采集历史舆情控制案例;
A2.根据历史舆情控制案例生成事件对象,事件对象包括事件标识、开始时间、结束时间、事件主题、事件关键词、事件简介;
A3.将事件对象存储为舆情案例库。
其中,事件标识可以唯一标识事件,其具体可以为事件编号等。事件名称具体可以是公众对事件形成的共识性的简称。开始时间是指事件开始在互联网上受到广泛关注并引发讨论的时间;结束时间是指时间由于得到合理处理或在公众博弈的过程中自发平息的时间。由于舆情事件的开始中自发平息的时间。由于舆情事件开始和结束都需要一个过程,因中自发平息的时间。由于舆情事件开始和结束都需要一个过程,因此开始时间和结束时间是指能代表该过程的一个时间点。事件主题是事件所属的主题分类。事件关键词是描述事件的主要关键词。事件简介是指在一定篇幅限制内,对事件的时间、地点、起因等要素的简要描述。
在舆情案例库构建过程中,引入面向对象技术将历史舆情控制案例模型化为对象,并作为舆情案例库中的一个独立知识单元,能在关系数据库的基础上进行更复杂的知识表示和知识推理。构建舆情案例库可以形成系统的案例经验,作为同类型案例的借鉴,指导当前的舆情控制。舆论案例库可以提供案例的描述,便于相关案例的关联和纵向分析,可以增强对相似舆情事件的认知和理解,有助于相关机构或组织在面临新的舆情事件时,能够进行更加精确的推断和预测。
事件对象还可以包括最高预警等级和/或事件响应策略。
最高预警等级是事件发展过程中所形成的最高预警等级。事件响应策略是相关机构或组织对事件采取的响应和处置措施。事件对象中的最高预警等级和事件响应策略可以为相关机构或组织在面对新的舆情事件要进行决策时,可以浏览舆情案例库中的时间对象以获得相似时间的处置决策方法。
传统的舆情案例库以文档为主,描述粒度过大,不利于舆情事件间的关联分析与挖掘,事件对象所包括的内容更加细粒度,可以后续的案例相似度计算、事件演变分析等提供基础数据支撑。
如图2所示,步骤A3具体可以包括:
A31.提取历史舆情控制案例中每个句子的施事词汇、受事词汇、地点词汇和谓词;
A32.当施事词汇或受事词汇属于同一类舆情人物词库,且施事词汇或受事词汇或谓词属于同一类舆情事件词库,则将历史舆情控制案例所对应生成的事件对象分类为同一类;或者,当地点词汇属于同一类舆情地点词库,且施事词汇或受事词汇或谓词属于同一类舆情事件词库,则将历史舆情控制案例所对应生成的事件对象分类为同一类;
A33.将分类后的事件对象分类存储为舆情案例库。
分类好的事件对象,可以在构建舆情案例库时进行分类存储,便于后续对事件对象的分类调用和分析。历史舆情控制案例主要包括三个方面的词库,分别是人物、地点、事件。由于大部分词的排他特性,所以舆情的人物、地点、事件的共现性在案例检测中尤为重要。可以认为一句话中如果同时出现某一类案例中的人物+事件或地点+事件组合,则该语句极有可能是属于该类案例。然而,仅仅判定词语是否在句子中进行案例分类,容易出现会出现错判、误判的情况。在进行分类时,可以利用LTP的语义角色标注方法获取每条句子当中的四类关键词:施事词汇(A0)、受事词汇(A1)、地点词汇(LOC)、谓词(Predicate),结合这四类关键词出现的语义角色位置可以进一步提高案例类别的判定准确性。
“事件”往往会以形容词的形式出现在施事词汇或受事词汇中或以动词的形式出现在谓词当中。“人物”多数出现在施事词汇或受事词汇中,“地点”只会出现在地点词汇中,如果想要确定语句的属于某一类舆情,需要同时满足以下两个条件:
(1)施事词汇或受事词汇属于该类舆情人物词库中的词语;
(2)施事词汇或受事词汇或谓词属于该类舆情事件词库中的词语。
或者,同时满足以下两个条件:
(1)地点词汇属于该类舆情地点词库中的词语;
(2)施事词汇或受事词汇或谓词属于该类舆情事件词库中的词语。
舆情任务词库、舆情地点词库、舆情事件词库可以是预设的。通过上述人物+事件或地点+事件进行案例类型判别的方法,考虑到了关键词在语句中的位置,避免盲目词汇匹配造成的错误判断,降低了舆情类别误判的概率。
在步骤A31之后,舆情知识库构建方法还可以包括:
A321.将所提取的施事词汇、受事词汇、地点词汇和谓词标注为关键词;
A322.将关键词与实体敏感库中的词汇进行匹配,将与实体敏感库中的词汇相匹配的关键词标注为舆情关键词。
舆情关键词是舆情文本的主干,代表着文本内容的主题,舆情预估也需要以舆情关键词为核心。实体敏感库可以是预设的,包括敏感的人名、地名、机构名等,将关键词与实体敏感库中的敏感人名、地名、机构名等进行匹配,所匹配得到的词汇作为舆情关键词,可以便于后续对历史舆情控制案例的进一步分析以及案例相似性、关联性分析等。
可以理解的是,步骤A321和步骤A322可以与步骤A32同时进行,也可以先后进行。
如图3所示,舆情知识库构建方法还可以包括舆情主题库的构建步骤:
B1.建立舆情主题;
B2.根据舆情主题生成多级主题对象,主题对象包括主题级别和主题名称;
B3.将主题对象存储为舆情主题库。
舆情主题库是关于舆情内容所属主题的知识库,每个主题对象作为舆情主题库中的一个独立知识单元,建立主题库有利于对舆情事件实施归类,从而可以有针对性地掌握舆情状况。
多级的主题对象,可以呈现层次化结构,层次越高主题类别粒度越粗。例如,对于土地规划公示,最高层级的舆情主题可以为矿产资源管理、城乡建设用地规划、土地复垦、耕地保护等,城乡建设用地规划的下一层级舆情主题可以是城中村拆迁、学区房划定等。
主题对象的结构可以是<级别编码,主题名>。设城乡建设用地规划的级别编码是1,城中村拆迁的级别编码为1.1,学区房划定的级别编码是1.2。则所形成的多级主题对象为:<1,城乡建设用地规划>、<1.1,城中村拆迁>、<1.2,学区房划定>。
如图4所示,舆情知识库构建方法还可以包括舆情评估指标库的构建步骤:
C1.建立以传播扩散性、民众关注度、内容敏感性和态度倾向性作为一级评估指标的多级评估指标;
C2.根据评估指标生成评估指标对象,评估指标对象包括指标级别和指标名称;
C3.将评估指标对象存储为舆情评估指标库。
舆情评估指标库是评估舆情态势的知识库,每个评估指标对象作为舆情评估指标库中的一个独立知识单元,一级评估指标下可以对应有二级评估指标、三级评估指标等。多级评估指标可以呈现层次化结构。4个一级评估指标传播扩散性、民众关注度、内容敏感性和态度倾向性,是根据舆情本身的性质和特点以及舆情演化的规律和条件所设置的。在进行舆情评估时,可以运用舆情评估指标库中的各项评估指标对象对当前舆情事件进行全面评估。
评估指标对象的结构可以是<级别编码,指标名称>。
如图5所示,舆情知识库构建方法还可以包括舆情预警等级库的构建步骤:
D1.根据评估指标的一个或多个建立预警等级;
D2.根据预警等级生成预警等级对象,预警等级对象包括等级编号、等级名称、标示颜色和判断标准;
D3.将预警等级对象存储为舆情预警等级库。
事件发生之初出现的观点和意见往往具有很强的导向性,会给后来的讨论定下基调和方向。人们常常倾向于相信这些“先声”,容易认同它的价值判断,附和它的意见主张。这种现象称为“首因效应”。如果出现谣言时不能及时做出解释将造成极大的负面影响,因此要快速发现舆情危机,准确找出谣言的源头并对用户发出警示。舆情预警等级库是关于舆情事件预警响应级别的知识库,每个预警等级对象作为舆情预警等级库的一个独立知识单元,可以快速辅助危机预警并引导决策。
例如,舆情预警等级可以划分为IV级(非常态)、III级(警示级)、II级(危险级)、I级(极度危险级),并可以依次采用蓝色、黄色、橙色和红色标示。各预警等级的判断标准可以是:IV级,民众关注度较低,传播扩散性慢,没有转换为行为舆情的可能;III级,民众关注度较高,传播扩散性中等,没有转换为行为舆情的可能;II级,民众关注度较高,传播扩散性快,舆情有转换为行为舆情的可能;I级:民众关注度极高,传播扩散性非常快,舆情即将转换为行为舆情。
预警等级对象的结构可以是<等级编号,等级名称,标示颜色,判断标准>。
如图6所示,舆情知识库构建方法还可以包括舆情处置策略库的构建步骤:
E1.根据不同对象类别和/或不同时空信息和/或不同评估指标和/或不同预警等级制定不同的响应策略;
E2.将响应策略存储为舆情处置策略库。
舆情处置策略库是关于舆情事件处置策略的知识库,每个响应策略作为舆情处置策略库的一个独立知识单元。根据不同对象类别、不同时空信息、不同评估指标、不同预警等级制定不同的响应策略,使得响应策略对应不同的舆情主题、类别、发生位置、发展阶段、预警等级等,为当前舆情事件的决策提供参考。
本实施例针对舆情监管,采用知识表示方式存储、组织、管理和使用相互联系的知识片集合形成舆情知识库,包括舆情案例库、舆情主题库、舆情评估指标库、舆情预警等级库和舆情处置策略库,由此可以通过舆情知识库快速获取知识信息进行舆情监管。
实施例2
如图7所示,本实施例提供一种舆情知识库,包括舆情案例库,舆情案例库可以采用如实施例1的方法进行构建。
舆情知识库还可以包括舆情主题库和/或舆情评估指标库和/或舆情预警等级库和/或舆情处置策略库,舆情主题库、舆情评估指标库、舆情预警等级库、舆情处置策略库可以分别采用如实施例1的方法进行构建。
构建舆情知识库,可以存储和关联在舆情数据采集和信息抽取、民众情感倾向性分析、事件关联分析、舆情威胁估计和趋势分析等过程中的基础知识和参数。舆情案例库,可以用于借鉴同类案例的响应和处置策略;舆情主题库,可以建立层次化的舆情主题,实施舆情事件归类,针对性地掌握各类舆情事件的舆情特征;舆情评估指标库,可以根据舆情本身的性质和特点以及舆情演化的规律和条件,建立传播扩散性、民众关注度、内容敏感性和态度倾向性4个一级评估指标及相应的二级、三级等指标;舆情预警等级库,可以根据评估指标构建不同的预警等级,并以不同的颜色标示不同的预警等级;舆情处置策略库,可以根据不同的舆情主题、发展阶段、预警等级制定不同的响应策略。
在舆情知识库的应用过程中,可以将当前舆情事件与舆情案例库中的历史舆情控制案例进行相似性匹配,得到最相似的舆情案例,根据最相似的舆情案例分析得到舆情控制方案。
不同的舆情案例,其案例结构有不同的特点,而且舆情案例信息可能会不完整,对案例控制方案的信息描述也可能会不完整。进行舆情事件与历史舆情控制案例进行相似性匹配,可以采用以下步骤:
将舆情事件的属性结构与舆情案例库中的历史舆情控制案例的属性结构进行结构相似性匹配,得到舆情对象所属的事件类型;
将舆情对象的属性与舆情案例库中属于事件类型的历史舆情控制案例的属性值进行属性相似性匹配,得到最相似的舆情案例。
考虑匹配出的最相似舆情案例仅以相似度作为唯一标准,在可信度方面欠缺,因此可以在相似性匹配的基础上再结合置信度分析。进行舆情事件与历史舆情控制案例进行相似性匹配,还可以包括以下步骤:
预设置信度指标,建立置信度决策树;
根据置信度决策树,分析舆情对象的属性(如时空信息、语义信息、情感信息等)是否可信。
采用上述的结构相似性匹配和属性相似性匹配的方式,虽然可以得到较精确的相似度,但是需要的时间代价比较大,当舆情案例库不断增大时,所需要的时间也会同比例增加。因此,可以采用基于贝叶斯概率模型进行相似性匹配,可以降低匹配的时间成本。
记某舆情对象为X,舆情案例库中第i个事件类型为Ci,事件类型Ci由若干个舆情案例组成;
按照下式计算舆情对象X与事件类型Ci的结构相似度S(X,Ci):
Figure BDA0002610394880000091
γ为经验因子,q为舆情对象X的属性个数,qs为舆情对象X与事件类型Ci的相同属性个数,k为事件类型Ci的属性个数。
根据结构相似度S(X,Cx),可以判断舆情对象X所属的事件类型为第x个事件类型Cx
具体地,可以预设阈值τ,当所计算的最大结构相似度S(X,Cx-max)大于预设阈值τ时,可以认为对应的舆情象X所属的事件类型为第x-max个事件类型Cx-max
记某舆情对象为X,舆情对象X所属的事件类型为第x个事件类型Cx,舆情案例库中属于事件类型Cx的某舆情案例为txj
由于属性之间的独立性,也即依赖关系不存在与条件属性之间,所以可以计算条件概率:
Figure BDA0002610394880000101
Figure BDA0002610394880000102
则有:
Figure BDA0002610394880000103
Figure BDA0002610394880000104
综上,可以按照下式计算条件概率:
Figure BDA0002610394880000105
Figure BDA0002610394880000106
Figure BDA0002610394880000107
nxj为舆情案例库中属于事件类型Cx且与舆情对象X属性相匹配的舆情案例个数,n为舆情案例库中的舆情案例总数,Xy为舆情对象X的属性,nxj(Xy)为事件类型Cx中具有属性Xy的舆情案例个数,ωxy是事件类型Cx的属性权重。
根据条件概率pΦX|txj)p(txj),可以判断得到最相似的舆情案例。
具体地,可以将条件概率最大的一个舆情案例或者最大的多个舆情案例作为舆情对象X的最相似的舆情案例。可以按照下式计算最大条件概率对应的舆情案例:
Figure BDA0002610394880000108
显然,本发明的上述实施例仅仅是为了清楚地说明本发明技术方案所作的举例,而并非是对本发明的具体实施方式的限定。凡在本发明权利要求书的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (10)

1.一种舆情知识库构建方法,其特征在于,包括:
采集历史舆情控制案例;
根据所述历史舆情控制案例生成事件对象,所述事件对象包括事件标识、开始时间、结束时间、事件主题、事件关键词、事件简介;
将所述事件对象存储为舆情案例库。
2.根据权利要求1所述的舆情知识库构建方法,其特征在于,将所述历史舆情控制案例存储为舆情案例库,包括:
提取所述历史舆情控制案例中每个句子的施事词汇、受事词汇、地点词汇和谓词;
当所述施事词汇或受事词汇属于同一类舆情人物词库,且所述施事词汇或所述受事词汇或所述谓词属于同一类舆情事件词库,则将所述历史舆情控制案例所对应生成的事件对象分类为同一类;
或者,当所述地点词汇属于同一类舆情地点词库,且所述施事词汇或所述受事词汇或所述谓词属于同一类舆情事件词库,则将所述历史舆情控制案例所对应生成的事件对象分类为同一类;
将分类后的所述历史舆情控制案例分类存储为舆情案例库。
3.根据权利要求2所述的舆情知识库构建方法,其特征在于,在提取所述历史舆情控制案例中每个句子的施事词汇、受事词汇、地点词汇和谓词之后,还包括:
将所提取的所述施事词汇、所述受事词汇、所述地点词汇和所述谓词标注为关键词;
将所述关键词与实体敏感库中的词汇进行匹配,将与所述实体敏感库中的词汇相匹配的所述关键词标注为舆情关键词。
4.根据权利要求1至3任一项所述的舆情知识库构建方法,其特征在于,还包括:
建立舆情主题;
根据所述舆情主题生成多级主题对象,所述主题对象包括主题级别和主题名称;
将所述主题对象存储为舆情主题库。
5.根据权利要求4所述的舆情知识库构建方法,其特征在于,还包括:
建立以传播扩散性、民众关注度、内容敏感性和态度倾向性作为一级评估指标的多级评估指标;
根据所述评估指标生成评估指标对象,所述评估指标对象包括指标级别和指标名称;
将所述评估指标对象存储为舆情评估指标库。
6.根据权利要求5所述的舆情知识库构建方法,其特征在于,还包括:
根据所述评估指标的一个或多个建立预警等级;
根据所述预警等级生成预警等级对象,所述预警等级对象包括等级编号、等级名称、标示颜色和判断标准;
将所述预警等级对象存储为舆情预警等级库。
7.根据权利要求6所述的舆情知识库构建方法,其特征在于,还包括:
根据不同所述对象类别和/或不同所述时空信息和/或不同所述评估指标和/或不同所述预警等级制定不同的响应策略;
将所述响应策略存储为舆情处置策略库。
8.根据权利要求7所述的舆情知识库构建方法,其特征在于,所述事件对象还包括最高预警等级和/或事件响应策略。
9.一种舆情知识库,其特征在于,包括如权利要求1至3任一项所述的舆情知识库构建方法所构建的舆情案例库。
10.一种舆情知识库,其特征在于,包括如权利要求7所述舆情知识库构建方法所构建的舆情案例库,以及舆情主题库和/或舆情评估指标库和/或舆情预警等级库和/或舆情处置策略库。
CN202010752163.0A 2020-07-30 2020-07-30 一种舆情知识库构建方法及舆情知识库 Active CN111914141B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010752163.0A CN111914141B (zh) 2020-07-30 2020-07-30 一种舆情知识库构建方法及舆情知识库

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010752163.0A CN111914141B (zh) 2020-07-30 2020-07-30 一种舆情知识库构建方法及舆情知识库

Publications (2)

Publication Number Publication Date
CN111914141A true CN111914141A (zh) 2020-11-10
CN111914141B CN111914141B (zh) 2023-01-10

Family

ID=73288070

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010752163.0A Active CN111914141B (zh) 2020-07-30 2020-07-30 一种舆情知识库构建方法及舆情知识库

Country Status (1)

Country Link
CN (1) CN111914141B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112766506A (zh) * 2021-01-19 2021-05-07 澜途集思生态科技集团有限公司 一种基于架构的知识库构建方法
CN117131944A (zh) * 2023-10-24 2023-11-28 中国电子科技集团公司第十研究所 面向多领域的交互式危机事件动态预警方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544255A (zh) * 2013-10-15 2014-01-29 常州大学 基于文本语义相关的网络舆情信息分析方法
WO2018023981A1 (zh) * 2016-08-03 2018-02-08 平安科技(深圳)有限公司 舆情分析方法、装置、设备及计算机可读存储介质
CN108491183A (zh) * 2018-04-04 2018-09-04 联想(北京)有限公司 一种信息处理方法和电子设备
WO2018218708A1 (zh) * 2017-05-27 2018-12-06 中国矿业大学 一种基于深度学习的舆情热点类别划分方法
CN109241429A (zh) * 2018-09-05 2019-01-18 食品安全与营养(贵州)信息科技有限公司 一种食品安全舆情监控方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544255A (zh) * 2013-10-15 2014-01-29 常州大学 基于文本语义相关的网络舆情信息分析方法
WO2018023981A1 (zh) * 2016-08-03 2018-02-08 平安科技(深圳)有限公司 舆情分析方法、装置、设备及计算机可读存储介质
WO2018218708A1 (zh) * 2017-05-27 2018-12-06 中国矿业大学 一种基于深度学习的舆情热点类别划分方法
CN108491183A (zh) * 2018-04-04 2018-09-04 联想(北京)有限公司 一种信息处理方法和电子设备
CN109241429A (zh) * 2018-09-05 2019-01-18 食品安全与营养(贵州)信息科技有限公司 一种食品安全舆情监控方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112766506A (zh) * 2021-01-19 2021-05-07 澜途集思生态科技集团有限公司 一种基于架构的知识库构建方法
CN117131944A (zh) * 2023-10-24 2023-11-28 中国电子科技集团公司第十研究所 面向多领域的交互式危机事件动态预警方法及系统
CN117131944B (zh) * 2023-10-24 2024-01-12 中国电子科技集团公司第十研究所 面向多领域的交互式危机事件动态预警方法及系统

Also Published As

Publication number Publication date
CN111914141B (zh) 2023-01-10

Similar Documents

Publication Publication Date Title
CN108763333B (zh) 一种基于社会媒体的事件图谱构建方法
US11019107B1 (en) Systems and methods for identifying violation conditions from electronic communications
CN108073569B (zh) 一种基于多层级多维度语义理解的法律认知方法、装置和介质
WO2020000847A1 (zh) 一种基于新闻大数据的恐慌指数监测分析方法及系统
CN110390023A (zh) 一种基于改进bert模型的知识图谱构建方法
CN104820629A (zh) 一种智能的舆情突发事件应急处理系统及方法
CN110968699A (zh) 一种基于事理推荐的逻辑图谱构建及预警方法和装置
CN111967761B (zh) 一种基于知识图谱的监控预警方法、装置及电子设备
Cao et al. A risky large group emergency decision-making method based on topic sentiment analysis
Van de Camp et al. The socialist network
CN111914141B (zh) 一种舆情知识库构建方法及舆情知识库
CN111914087A (zh) 一种舆情分析方法
Boholm How do Swedish Government agencies define risk?
CN112883286A (zh) 基于bert的新冠肺炎疫情微博情感分析方法、设备、介质
Rahmadan et al. Sentiment analysis and topic modelling using the lda method related to the flood disaster in jakarta on twitter
CN114528405A (zh) 一种基于网络突发热点的舆情监测方法
CN115033705A (zh) 电网调控风险预警信息知识图谱设计方法及系统
Wan et al. Evaluation model of power operation and maintenance based on text emotion analysis
CN116881395A (zh) 一种舆情信息检测方法和装置
Parolin et al. Come-ke: A new transformers based approach for knowledge extraction in conflict and mediation domain
Loerakker et al. Fine-tuning language models on dutch protest event tweets
CN114417008A (zh) 一种面向建设工程领域的知识图谱构建方法及系统
Cherichi et al. Using big data values to enhance social event detection pattern
CN110750622A (zh) 基于大数据的金融事件发现方法
Li et al. Sentiment analysis and prediction model based on Chinese government affairs microblogs

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant