CN111611408A - 一种舆情分析方法、装置、计算机设备及存储介质 - Google Patents
一种舆情分析方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN111611408A CN111611408A CN202010464431.9A CN202010464431A CN111611408A CN 111611408 A CN111611408 A CN 111611408A CN 202010464431 A CN202010464431 A CN 202010464431A CN 111611408 A CN111611408 A CN 111611408A
- Authority
- CN
- China
- Prior art keywords
- public opinion
- target service
- data
- map data
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 56
- 238000012098 association analyses Methods 0.000 claims abstract description 36
- 238000000034 method Methods 0.000 claims abstract description 28
- 230000035699 permeability Effects 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 4
- 238000010219 correlation analysis Methods 0.000 abstract description 6
- 238000005065 mining Methods 0.000 abstract description 5
- 238000011156 evaluation Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 230000009193 crawling Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种舆情分析方法、装置、计算机设备及存储介质,其中,该方法包括:获取与至少一个目标业务中每个目标业务对应的多个舆情信息;针对每个目标业务,基于预先构建的知识图谱结构以及该目标业务对应的多个舆情信息,确定该目标业务的舆情图谱数据;根据舆情图谱数据构建与每个目标业务对应的知识图谱数据库,以便于利用各个知识图谱数据库对至少一个目标业务进行关联分析。采用上述方案结合知识图谱结构提取舆情信息中的舆情图谱数据,以通过构建的知识图谱数据库实现各个目标业务之间的关联分析,实现了对舆情信息的自动挖掘,提升了舆情分析的效率。
Description
技术领域
本申请涉及计算机应用技术领域,具体而言,涉及一种舆情分析方法、装置、计算机设备及存储介质。
背景技术
随着互联网媒体的发展和信息时代的来临,信息的传播借助各种互联网媒体快速传播,舆情分析成为互联网发展的关键研究方向。通常情况下,可以通过相关工作人员进行分析挖掘。
考虑到舆情信息的离散程度较大,其在表面上看起来没有关联,因此,往往需要工作人员耗费大量的时间精力对舆情信息进行广度和深度上的挖掘,导致舆情分析的效率较低。
发明内容
有鉴于此,本申请的目的在于提供一种舆情分析方法、装置、计算机设备及存储介质,通过对舆情信息进行知识图谱分析,提升了舆情分析的效率。
主要包括以下几个方面:
第一方面,本申请提供了一种舆情分析方法,所述方法包括:
获取与至少一个目标业务中每个目标业务对应的多个舆情信息;
针对每个所述目标业务,基于预先构建的知识图谱结构以及该目标业务对应的多个舆情信息,确定该目标业务的舆情图谱数据;
根据所述舆情图谱数据构建与每个所述目标业务对应的知识图谱数据库,以便于利用各个所述知识图谱数据库对所述至少一个目标业务进行关联分析。
在一些实施方式中,所述针对每个所述目标业务,基于预先构建的知识图谱结构以及该目标业务对应的多个舆情信息,确定该目标业务的舆情图谱数据,包括:
针对每个所述目标业务,将该目标业务对应的多个舆情信息输入至预先训练好的数据类型提取模型中,确定每个舆情信息的知识图谱数据类型;
根据各个所述舆情信息、所述每个舆情信息对应的知识图谱数据类型以及预先构建的知识图谱结构,确定该目标业务的舆情图谱数据。
在一些实施方式中,所述根据各个所述舆情信息、所述每个舆情信息对应的知识图谱数据类型以及预先构建的知识图谱结构,确定该目标业务的舆情图谱数据,包括:
针对每个目标业务,基于该目标业务对应的多个舆情信息中每个舆情信息对应的知识图谱数据类型,将各个舆情信息按照预先构建的知识图谱结构进行舆情图谱数据的提取,得到该目标业务的舆情图谱数据。
在一些实施方式中,所述利用各个所述知识图谱数据库对所述至少一个目标业务进行关联分析,包括:
针对需要关联分析的多个目标业务,确定所述多个目标业务之间的关联图谱数据,根据所述关联图谱数据对所述多个目标业务中的每个目标业务对应的知识图谱数据库进行关联分析,得到关联分析结果。
在一些实施方式中,所述方法还包括:
针对每个所述目标业务,从该目标业务对应的知识图谱数据库的舆情图谱数据中,提取出符合预设业务需求的舆情实体数据;以及确定该目标业务所涉及用户的画像数据;
基于所述画像数据,确定所述舆情实体数据在所述舆情图谱数据中的渗透率;
若所述渗透率大于预设阈值,则确定所述目标业务能够满足业务需求。
第二方面,本申请还提供了一种舆情分析装置,所述装置包括:
获取模块,用于获取与至少一个目标业务中每个目标业务对应的多个舆情信息;
确定模块,用于针对每个所述目标业务,基于预先构建的知识图谱结构以及该目标业务对应的多个舆情信息,确定该目标业务的舆情图谱数据;
分析模块,用于根据所述舆情图谱数据构建与每个所述目标业务对应的知识图谱数据库,以便于利用各个所述知识图谱数据库对所述至少一个目标业务进行关联分析。
在一些实施方式中,所述确定模块,用于按照以下步骤确定每个目标业务的舆情图谱数据:
针对每个所述目标业务,将该目标业务对应的多个舆情信息输入至预先训练好的数据类型提取模型中,确定每个舆情信息的知识图谱数据类型;
根据各个所述舆情信息、所述每个舆情信息对应的知识图谱数据类型以及预先构建的知识图谱结构,确定该目标业务的舆情图谱数据。
在一些实施方式中,所述分析模块,用于对所述至少一个目标业务进行关联分析:
针对需要关联分析的多个目标业务,确定所述多个目标业务之间的关联图谱数据,根据所述关联图谱数据对所述多个目标业务中的每个目标业务对应的知识图谱数据库进行关联分析,得到关联分析结果。
第三方面,本申请还提供了一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当所述计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述处理器执行所述机器可读指令时实现如第一方面及其各种实施方式任一所述的舆情分析方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面及其各种实施方式任一所述的舆情分析方法的步骤。
采用上述方案,其首先获取与至少一个目标业务中每个目标业务对应的多个舆情信息,然后针对每个所述目标业务,基于预先构建的知识图谱结构以及该目标业务对应的多个舆情信息,确定该目标业务的舆情图谱数据,最后根据所述舆情图谱数据构建与每个所述目标业务对应的知识图谱数据库,以便于利用各个所述知识图谱数据库对所述至少一个目标业务进行关联分析。可知,上述方案结合知识图谱结构提取舆情信息中的舆情图谱数据,以通过构建的知识图谱数据库实现各个目标业务之间的关联分析,实现了对舆情信息的自动挖掘,避免了需要工作人员耗费大量的时间精力对舆情信息进行广度和深度上的挖掘所导致的效率较低的问题,提升了舆情分析的效率。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例一所提供的一种舆情分析方法的流程图;
图2示出了本申请实施例一所提供的另一种舆情分析方法的流程图;
图3示出了本申请实施例一所提供的另一种舆情分析方法的流程图;
图4示出了本申请实施例二所提供的一种舆情分析装置的结构示意图;
图5示出了本申请实施例三所提供的一种计算机设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
经研究发现,相关技术中在进行舆情分析的过程中,需要工作人员耗费大量的时间精力对舆情信息进行广度和深度上的挖掘,导致舆情分析的效率较低。
基于上述研究,本申请提供了至少一种舆情分析方案,其通过对舆情信息进行知识图谱分析,提升了舆情分析的效率。
针对以上方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本申请针对上述问题所提出的解决方案,都应该是发明人在本申请过程中对本申请做出的贡献。
下面将结合本申请中附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
为便于对本实施例进行理解,首先对本申请实施例所申请的一种舆情分析方法进行详细介绍,本申请实施例所提供的舆情分析方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该舆情分析方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
下面以服务器为执行主体对本申请实施例提供的舆情分析方法加以说明。
实施例一
参见图1所示,为本申请实施例一提供的舆情分析方法的流程图,方法包括步骤S101~S103,其中:
S101、获取与至少一个目标业务中每个目标业务对应的多个舆情信息;
S102、针对每个目标业务,基于预先构建的知识图谱结构以及该目标业务对应的多个舆情信息,确定该目标业务的舆情图谱数据;
S103、根据舆情图谱数据构建与每个目标业务对应的知识图谱数据库,以便于利用各个知识图谱数据库对至少一个目标业务进行关联分析。
这里,首先可以获取与至少一个目标业务中每个业务对应的多个舆情信息,而后,可以针对每个目标业务,基于预先构建的知识图谱结果以及该目标业务对应的多个舆情信息,确定上述目标业务的舆情图谱数据,最后根据舆情图谱数据构建与每个目标业务对应的知识图谱数据库以利用各个知识图谱数据库对各个目标业务进行关联分析,由于上述舆情分析方法结合知识图谱结构提取舆情信息中的舆情图谱数据,并通过构建的知识图谱数据库实现各个目标业务之间的关联分析,实现了对舆情信息的自动挖掘,避免了需要工作人员耗费大量的时间精力对舆情信息进行广度和深度上的挖掘所导致的效率较低的问题,提升了舆情分析的效率。
其中,本申请实施例中的目标业务可以为一个,也可以为多个,每个目标业务可以对应产品的一个应用功能。本申请实施例中,可以是具有产品评价功能的评论业务,还可以是具有产品推送功能的推送业务,还可以是其它具有各种应用功能的目标业务,本申请实施例对此不做具体的限制。
这样,可以获取与每个目标业务对应的多个舆情信息。以评论业务为例,该业务所对应的舆情信息可以是与评论内容相关的各种用户评价信息。在具体应用的过程中,可以通过互联网爬虫方式进行相关舆情信息的爬取,这时,可以基于预设的关键词进行信息爬取,例如,可以基于质量、性能等关键词等爬取与评论业务相关的舆情信息。除此之外,在进行舆情信息爬取的过程中,针对不同的用户人群,所爬取的数据也可以不同。例如,针对跑车评价业务与商务车评价业务而言,作为不同的产品,其所具备的目标用户也是不同的,本申请实施例中,主要是基于产品或服务的主要对象人群进行舆情信息的爬取。
在爬取到舆情信息之后,即可以针对各个目标业务进行舆情图谱数据的确定,这里,可以先对目标业务的多个舆情信息进行知识图谱数据类型的提取,然后在基于预先构建的知识图谱结构实现舆情图谱数据的确定。
其中,本申请实施例中的知识图谱数据类型主要包括实体类型、关系类型,预先构建的知识图谱结构构建的是知识图谱三元素:实体(实体是指在现实中不做进一步分割的一类对象)、事件(事件是在特定时空维度如网吧,车站等刻画主题和客体间关系的一类)、关系(关系是刻画实体间各种关联的一类对象)等,这样,在确定舆情信息所对应的知识图谱数据类型之后,即可以按照知识图谱结构确定出三元素的具体内容,从而可以构建对应每个目标业务的知识图谱数据库。
这样,在进行各个目标业务中的一些或全部目标业务的关联分析时,即可以从各个待关联分析的目标业务所对应的知识图谱数据库中确定出关联图谱数据,即可以基于关联图谱数据将各个目标业务的知识图谱数据进行集成,从而得到关联分析结果。
本申请实施例中,如图2所示,可以按照如下内容确定目标业务的舆情图谱数据:
S201、针对每个目标业务,将该目标业务对应的多个舆情信息输入至预先训练好的数据类型提取模型中,确定每个舆情信息的知识图谱数据类型;
S202、根据各个舆情信息、每个舆情信息对应的知识图谱数据类型以及预先构建的知识图谱结构,确定该目标业务的舆情图谱数据。
这里,可以针对每个目标业务,将该目标业务对应的各个舆情信息输入至预先训练好的数据类型提取模型中,以确定每个舆情信息的知识图谱数据类型,这样,即可以根据各个舆情信息、每个舆情信息对应的知识图谱数据类型以及预先构建的知识图谱结构,确定该目标业务的舆情图谱数据。
其中,上述数据类型提取模型可以是基于标注好知识图谱数据类型结果的训练数据训练完成的。本申请实施例中,在进行数据类型提取模型的训练之前,可以预先定义需要标注的实体,关系和事件的类型,然后通过人工标注文本中的实体、关系、事件训练数据类型提取模型。
在具体应用的过程中,可以基于自然语言处理(Natural Langunge Possns,NLP)技术实现标注。
在训练完成之后,即可以将从互联网获取的大量舆情信息通过数据类型提取模型完成标注,也即,可确定与每个舆情信息对应的知识图谱数据类型,从而确定标注后的舆情信息。
这时,可以基于预先构建的知识图谱结构以及标注后的舆情信息,确定目标业务的舆情图谱数据,也即,针对每个目标业务,基于该目标业务对应的多个舆情信息中每个舆情信息对应的知识图谱数据类型,将各个舆情信息按照预先构建的知识图谱结构进行舆情图谱数据的提取,得到该目标业务的舆情图谱数据。
本申请实施例中,可以在确定一个舆情信息的知识图谱数据类型为实体类型时,可以按照知识图谱结构所对应的三元素确定该舆情信息为三元素中的实体元素,还可以在确定一个舆情信息的知识图谱数据类型为关系类型时,可以按照知识图谱结构所对应的三元素确定该舆情信息为三元素中的关系元素,从而得到对应的舆情图谱数据。
针对需要关联分析的多个目标业务,确定多个目标业务之间的关联图谱数据,根据关联图谱数据对多个目标业务中的每个目标业务对应的知识图谱数据库进行关联分析,得到关联分析结果。
本申请实施例中的关联图谱数据可以是与每个目标业务相关联的,还可以是每两个目标业务之间有对应的关联图谱数据,基于多个关联图谱数据将各个目标业务关联起来,本申请实施例对此不做具体的限制。
例如,一个目标业务通过舆情信息抽取出了一种实体、关系、事件之间的关系,比如,某条舆情提到张三是李四的儿子。另外一个舆情信息抽取出了另一种实体、关系、事件之间的关系,例如,李四是王五的儿子。这时,通过李四这一关系知识图谱数据可以将张三和李四联系起来,也即可以将分散的舆情关联起来进行分析。
本申请实施例中,为了确定目标业务是否能够满足业务需求,还可以基于画像数据进行图谱数据的分析,如图3所示,上述分析方法具体包括如下步骤:
S301、针对每个目标业务,从该目标业务对应的知识图谱数据库的舆情图谱数据中,提取出符合预设业务需求的舆情实体数据;以及确定该目标业务所涉及用户的画像数据;
S302、基于画像数据,确定舆情实体数据在舆情图谱数据中的渗透率;
S303、若渗透率大于预设阈值,则确定目标业务能够满足业务需求。
这里,针对每个目标业务,可以从目标业务对应的知识图谱数据库的舆情图谱数据中,提取出符合预设业务需求的舆情实体数据;以及确定该目标业务所涉及用户的画像数据,然后,基于画像数据,确定舆情实体数据在舆情图谱数据中的渗透率,若判断出渗透率大于预设阈值,则确定目标业务能够满足业务需求。
其中,针对舆情实体数据而言,可以是符合预设业务需求的实体数据,例如,可以是年龄在20-40岁的女性。针对评价业务而言,这时,可以从目标业务的知识图谱数据库中查找符合上述预设业务需求的实体数据在当前评价关系中,评价产品好用的有60人,总的评价关系有100个,这时,可以确定渗透率为0.6(大于预设阈值0.55),这时,可以确定当前的目标业务能够满足业务需求,若不满足渗透率判断条件,可以进一步调整业务作业情况,从而达到最终满足业务需求的目的。可见,采用本申请实施例提供的舆情分析方法能够在提前舆情分析效率的前提下,满足更多业务的需求,适应性更佳。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
基于同一发明构思,本申请实施例中还提供了与舆情分析方法对应的舆情分析装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述舆情分析方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
实施例二
参照图4所示,为本申请实施例二提供的一种舆情分析装置的示意图,装置包括:
获取模块401,用于获取与至少一个目标业务中每个目标业务对应的多个舆情信息;
确定模块402,用于针对每个目标业务,基于预先构建的知识图谱结构以及该目标业务对应的多个舆情信息,确定该目标业务的舆情图谱数据;
分析模块403,用于根据舆情图谱数据构建与每个目标业务对应的知识图谱数据库,以便于利用各个知识图谱数据库对至少一个目标业务进行关联分析。
在一些实施方式中,确定模块402,用于按照以下步骤确定每个目标业务的舆情图谱数据:
针对每个目标业务,将该目标业务对应的多个舆情信息输入至预先训练好的数据类型提取模型中,确定每个舆情信息的知识图谱数据类型;
根据各个舆情信息、每个舆情信息对应的知识图谱数据类型以及预先构建的知识图谱结构,确定该目标业务的舆情图谱数据。
在一些实施方式中,确定模块402,用于按照以下步骤确定该目标业务的舆情图谱数据:
针对每个目标业务,基于该目标业务对应的多个舆情信息中每个舆情信息对应的知识图谱数据类型,将各个舆情信息按照预先构建的知识图谱结构进行舆情图谱数据的提取,得到该目标业务的舆情图谱数据。
在一些实施方式中,分析模块403,用于对至少一个目标业务进行关联分析:
针对需要关联分析的多个目标业务,确定多个目标业务之间的关联图谱数据,根据关联图谱数据对多个目标业务中的每个目标业务对应的知识图谱数据库进行关联分析,得到关联分析结果。
在一些实施方式中,上述装置还包括:
判断模块404,用于针对每个目标业务,从该目标业务对应的知识图谱数据库的舆情图谱数据中,提取出符合预设业务需求的舆情实体数据;以及确定该目标业务所涉及用户的画像数据;
基于画像数据,确定舆情实体数据在舆情图谱数据中的渗透率;
若渗透率大于预设阈值,则确定目标业务能够满足业务需求。
实施例三
本申请实施例三所提供了一种计算机设备,如图5所示,该计算机设备包括:处理器501、存储器502和总线503,存储器502存储有处理器501可执行的机器可读指令(比如图4中的舆情分析装置中获取模块401、确定模块402以及分析模块403对应的执行指令等),当计算机设备运行时,处理器501与存储器502之间通过总线503通信,机器可读指令被处理器501执行时执行如下处理:
获取与至少一个目标业务中每个目标业务对应的多个舆情信息;
针对每个目标业务,基于预先构建的知识图谱结构以及该目标业务对应的多个舆情信息,确定该目标业务的舆情图谱数据;
根据舆情图谱数据构建与每个目标业务对应的知识图谱数据库,以便于利用各个知识图谱数据库对至少一个目标业务进行关联分析。
在一些实施方式中,上述处理器501执行的指令中,针对每个目标业务,基于预先构建的知识图谱结构以及该目标业务对应的多个舆情信息,确定该目标业务的舆情图谱数据,包括:
针对每个目标业务,将该目标业务对应的多个舆情信息输入至预先训练好的数据类型提取模型中,确定每个舆情信息的知识图谱数据类型;
根据各个舆情信息、每个舆情信息对应的知识图谱数据类型以及预先构建的知识图谱结构,确定该目标业务的舆情图谱数据。
在一些实施方式中,上述处理器501执行的指令中,根据各个舆情信息、每个舆情信息对应的知识图谱数据类型以及预先构建的知识图谱结构,确定该目标业务的舆情图谱数据,包括:
针对每个目标业务,基于该目标业务对应的多个舆情信息中每个舆情信息对应的知识图谱数据类型,将各个舆情信息按照预先构建的知识图谱结构进行舆情图谱数据的提取,得到该目标业务的舆情图谱数据。
在一些实施方式中,上述处理器501执行的指令中,利用各个知识图谱数据库对至少一个目标业务进行关联分析,包括:
针对需要关联分析的多个目标业务,确定多个目标业务之间的关联图谱数据,根据关联图谱数据对多个目标业务中的每个目标业务对应的知识图谱数据库进行关联分析,得到关联分析结果。
在一些实施方式中,上述处理器501执行的指令还包括:
针对每个目标业务,从该目标业务对应的知识图谱数据库的舆情图谱数据中,提取出符合预设业务需求的舆情实体数据;以及确定该目标业务所涉及用户的画像数据;
基于画像数据,确定舆情实体数据在舆情图谱数据中的渗透率;
若渗透率大于预设阈值,则确定目标业务能够满足业务需求。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器501运行时执行上述方法实施例中的舆情分析方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
本申请实施例所提供的舆情分析方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,程序代码包括的指令可用于执行上述方法实施例中的舆情分析方法的步骤,具体可参见上述方法实施例,在此不再赘述。
本申请实施例还提供一种计算机程序,该计算机程序被处理器执行时实现前述实施例的任意一种方法。该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software DevelopmentKit,SDK)等等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种舆情分析方法,其特征在于,所述方法包括:
获取与至少一个目标业务中每个目标业务对应的多个舆情信息;
针对每个所述目标业务,基于预先构建的知识图谱结构以及该目标业务对应的多个舆情信息,确定该目标业务的舆情图谱数据;
根据所述舆情图谱数据构建与每个所述目标业务对应的知识图谱数据库,以便于利用各个所述知识图谱数据库对所述至少一个目标业务进行关联分析。
2.根据权利要求1所述的方法,其特征在于,所述针对每个所述目标业务,基于预先构建的知识图谱结构以及该目标业务对应的多个舆情信息,确定该目标业务的舆情图谱数据,包括:
针对每个所述目标业务,将该目标业务对应的多个舆情信息输入至预先训练好的数据类型提取模型中,确定每个舆情信息的知识图谱数据类型;
根据各个所述舆情信息、所述每个舆情信息对应的知识图谱数据类型以及预先构建的知识图谱结构,确定该目标业务的舆情图谱数据。
3.根据权利要求2所述的方法,其特征在于,所述根据各个所述舆情信息、所述每个舆情信息对应的知识图谱数据类型以及预先构建的知识图谱结构,确定该目标业务的舆情图谱数据,包括:
针对每个目标业务,基于该目标业务对应的多个舆情信息中每个舆情信息对应的知识图谱数据类型,将各个舆情信息按照预先构建的知识图谱结构进行舆情图谱数据的提取,得到该目标业务的舆情图谱数据。
4.根据权利要求1所述的方法,其特征在于,所述利用各个所述知识图谱数据库对所述至少一个目标业务进行关联分析,包括:
针对需要关联分析的多个目标业务,确定所述多个目标业务之间的关联图谱数据,根据所述关联图谱数据对所述多个目标业务中的每个目标业务对应的知识图谱数据库进行关联分析,得到关联分析结果。
5.根据权利要求1~4任一所述的方法,其特征在于,所述方法还包括:
针对每个所述目标业务,从该目标业务对应的知识图谱数据库的舆情图谱数据中,提取出符合预设业务需求的舆情实体数据;以及确定该目标业务所涉及用户的画像数据;
基于所述画像数据,确定所述舆情实体数据在所述舆情图谱数据中的渗透率;
若所述渗透率大于预设阈值,则确定所述目标业务能够满足业务需求。
6.一种舆情分析装置,其特征在于,所述装置包括:
获取模块,用于获取与至少一个目标业务中每个目标业务对应的多个舆情信息;
确定模块,用于针对每个所述目标业务,基于预先构建的知识图谱结构以及该目标业务对应的多个舆情信息,确定该目标业务的舆情图谱数据;
分析模块,用于根据所述舆情图谱数据构建与每个所述目标业务对应的知识图谱数据库,以便于利用各个所述知识图谱数据库对所述至少一个目标业务进行关联分析。
7.根据权利要求6所述的装置,其特征在于,所述确定模块,用于按照以下步骤确定每个目标业务的舆情图谱数据:
针对每个所述目标业务,将该目标业务对应的多个舆情信息输入至预先训练好的数据类型提取模型中,确定每个舆情信息的知识图谱数据类型;
根据各个所述舆情信息、所述每个舆情信息对应的知识图谱数据类型以及预先构建的知识图谱结构,确定该目标业务的舆情图谱数据。
8.根据权利要求6所述的装置,其特征在于,所述分析模块,用于对所述至少一个目标业务进行关联分析:
针对需要关联分析的多个目标业务,确定所述多个目标业务之间的关联图谱数据,根据所述关联图谱数据对所述多个目标业务中的每个目标业务对应的知识图谱数据库进行关联分析,得到关联分析结果。
9.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当所述计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述处理器执行所述机器可读指令时实现如权利要求1-5任一所述的舆情分析方法的步骤。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现如权利要求1-5任一所述的舆情分析方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010464431.9A CN111611408A (zh) | 2020-05-27 | 2020-05-27 | 一种舆情分析方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010464431.9A CN111611408A (zh) | 2020-05-27 | 2020-05-27 | 一种舆情分析方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111611408A true CN111611408A (zh) | 2020-09-01 |
Family
ID=72200005
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010464431.9A Pending CN111611408A (zh) | 2020-05-27 | 2020-05-27 | 一种舆情分析方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111611408A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111986763A (zh) * | 2020-09-03 | 2020-11-24 | 平安国际智慧城市科技股份有限公司 | 疾病数据分析方法、装置、电子设备及存储介质 |
CN112000813A (zh) * | 2020-09-14 | 2020-11-27 | 支付宝(杭州)信息技术有限公司 | 知识库构建方法及装置 |
CN112632197A (zh) * | 2021-02-01 | 2021-04-09 | 上海冰鉴信息科技有限公司 | 基于知识图谱的业务关系处理方法及装置 |
CN113254755A (zh) * | 2021-07-19 | 2021-08-13 | 南京烽火星空通信发展有限公司 | 一种基于分布式框架的舆情并行关联挖掘方法 |
CN113468280A (zh) * | 2021-07-27 | 2021-10-01 | 浙江大华技术股份有限公司 | 一种数据认知方法、装置、设备及存储介质 |
CN113742501A (zh) * | 2021-08-31 | 2021-12-03 | 北京百度网讯科技有限公司 | 一种信息提取方法、装置、设备、及介质 |
CN115082129A (zh) * | 2022-05-30 | 2022-09-20 | 布瑞克(苏州)农业互联网股份有限公司 | 一种农产品自动报价的方法和系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090319436A1 (en) * | 2008-06-18 | 2009-12-24 | Delip Andra | Method and system of opinion analysis and recommendations in social platform applications |
CN109614550A (zh) * | 2018-12-11 | 2019-04-12 | 平安科技(深圳)有限公司 | 舆情监控方法、装置、计算机设备及存储介质 |
CN110134845A (zh) * | 2019-04-04 | 2019-08-16 | 平安科技(深圳)有限公司 | 项目舆情监控方法、装置、计算机设备及存储介质 |
CN110413784A (zh) * | 2019-07-23 | 2019-11-05 | 国家计算机网络与信息安全管理中心 | 基于知识图谱的舆情关联分析方法及系统 |
CN110633373A (zh) * | 2018-06-20 | 2019-12-31 | 上海财经大学 | 一种基于知识图谱和深度学习的汽车舆情分析方法 |
-
2020
- 2020-05-27 CN CN202010464431.9A patent/CN111611408A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090319436A1 (en) * | 2008-06-18 | 2009-12-24 | Delip Andra | Method and system of opinion analysis and recommendations in social platform applications |
CN110633373A (zh) * | 2018-06-20 | 2019-12-31 | 上海财经大学 | 一种基于知识图谱和深度学习的汽车舆情分析方法 |
CN109614550A (zh) * | 2018-12-11 | 2019-04-12 | 平安科技(深圳)有限公司 | 舆情监控方法、装置、计算机设备及存储介质 |
CN110134845A (zh) * | 2019-04-04 | 2019-08-16 | 平安科技(深圳)有限公司 | 项目舆情监控方法、装置、计算机设备及存储介质 |
CN110413784A (zh) * | 2019-07-23 | 2019-11-05 | 国家计算机网络与信息安全管理中心 | 基于知识图谱的舆情关联分析方法及系统 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111986763A (zh) * | 2020-09-03 | 2020-11-24 | 平安国际智慧城市科技股份有限公司 | 疾病数据分析方法、装置、电子设备及存储介质 |
CN111986763B (zh) * | 2020-09-03 | 2024-05-14 | 深圳平安智慧医健科技有限公司 | 疾病数据分析方法、装置、电子设备及存储介质 |
CN112000813A (zh) * | 2020-09-14 | 2020-11-27 | 支付宝(杭州)信息技术有限公司 | 知识库构建方法及装置 |
CN112632197A (zh) * | 2021-02-01 | 2021-04-09 | 上海冰鉴信息科技有限公司 | 基于知识图谱的业务关系处理方法及装置 |
CN112632197B (zh) * | 2021-02-01 | 2023-08-04 | 上海冰鉴信息科技有限公司 | 基于知识图谱的业务关系处理方法及装置 |
CN113254755A (zh) * | 2021-07-19 | 2021-08-13 | 南京烽火星空通信发展有限公司 | 一种基于分布式框架的舆情并行关联挖掘方法 |
CN113254755B (zh) * | 2021-07-19 | 2021-10-08 | 南京烽火星空通信发展有限公司 | 一种基于分布式框架的舆情并行关联挖掘方法 |
CN113468280A (zh) * | 2021-07-27 | 2021-10-01 | 浙江大华技术股份有限公司 | 一种数据认知方法、装置、设备及存储介质 |
CN113742501A (zh) * | 2021-08-31 | 2021-12-03 | 北京百度网讯科技有限公司 | 一种信息提取方法、装置、设备、及介质 |
CN115082129A (zh) * | 2022-05-30 | 2022-09-20 | 布瑞克(苏州)农业互联网股份有限公司 | 一种农产品自动报价的方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111611408A (zh) | 一种舆情分析方法、装置、计算机设备及存储介质 | |
EP3089055B1 (en) | Method and device for displaying information flows in social network, and server | |
CN103295145B (zh) | 一种基于用户消费特征向量的手机广告投放方法 | |
CN107657048B (zh) | 用户识别方法及装置 | |
CN109858040B (zh) | 命名实体识别方法、装置和计算机设备 | |
CN108364199B (zh) | 一种基于互联网用户评论的数据分析方法及系统 | |
WO2021027595A1 (zh) | 用户画像生成方法、装置、计算机设备和计算机可读存储介质 | |
EP3306486A1 (en) | Pushed information processing method, apparatus, and device, and non-volatile computer storage medium | |
CN106951571B (zh) | 一种给应用标注标签的方法和装置 | |
CN110362601B (zh) | 元数据标准的映射方法、装置、设备及存储介质 | |
CN107783976B (zh) | 用户信息挖掘方法及装置 | |
CN103927309A (zh) | 一种对业务对象标注信息标签的方法及装置 | |
CN107644106B (zh) | 自动挖掘业务中间人的方法、终端设备及存储介质 | |
CN112087667A (zh) | 一种信息处理方法、装置以及计算机存储介质 | |
CN104346408A (zh) | 一种对网络用户进行标注的方法与设备 | |
CN110069769A (zh) | 应用标签生成方法、装置及存储设备 | |
CN110807548A (zh) | 基于风电竞价用户的数据采集方法、装置、设备及介质 | |
CN115344340A (zh) | 基于捆绑会话组的交互方法、装置和计算机设备 | |
CN111314540B (zh) | 一种通信录搜索方法、装置、设备和可读存储介质 | |
US20180081884A1 (en) | Method and apparatus for processing input sequence, apparatus and non-volatile computer storage medium | |
CN109145307B (zh) | 用户画像识别方法、推送方法、装置、设备和存储介质 | |
CN110543457A (zh) | 轨迹类文档处理方法和装置、存储介质及电子装置 | |
CN114610955A (zh) | 一种智能检索方法、装置、电子设备及存储介质 | |
CN105824951A (zh) | 检索方法和装置 | |
CN115375484A (zh) | 基于矩阵分解的保险产品提取方法和装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200901 |