CN113672587A - 一种新媒体更新监测方法、系统、设备及介质 - Google Patents
一种新媒体更新监测方法、系统、设备及介质 Download PDFInfo
- Publication number
- CN113672587A CN113672587A CN202110799736.XA CN202110799736A CN113672587A CN 113672587 A CN113672587 A CN 113672587A CN 202110799736 A CN202110799736 A CN 202110799736A CN 113672587 A CN113672587 A CN 113672587A
- Authority
- CN
- China
- Prior art keywords
- new media
- monitoring
- updating
- account
- article
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 148
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000004458 analytical method Methods 0.000 claims abstract description 22
- 238000006243 chemical reaction Methods 0.000 claims abstract description 14
- 238000004590 computer program Methods 0.000 claims description 15
- 238000005516 engineering process Methods 0.000 claims description 15
- 238000003860 storage Methods 0.000 claims description 7
- 238000012806 monitoring device Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 206010044565 Tremor Diseases 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
- G06F16/986—Document structures and storage, e.g. HTML extensions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Computing Systems (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明提供了计算机技术领域的一种新媒体更新监测方法、系统、设备及介质,方法包括如下步骤:步骤S10、创建一敏感词库以及一错别字词库,并设定一监测周期;步骤S20、基于预设的各新媒体账号自动获取新媒体内容;步骤S30、对所述新媒体内容进行格式转换和解析,得到结构化数据;步骤S40、基于所述敏感词库、错别字词库以及监测周期对结构化数据进行监测,自动生成监测报告并进行存储。本发明的优点在于:极大的提升了新媒体更新监测的效率以及质量。
Description
技术领域
本发明涉及计算机技术领域,特别指一种新媒体更新监测方法、系统、设备及介质。
背景技术
新媒体是利用数字技术,通过计算机网络、无线通信网、卫星等渠道,以及电脑、手机、数字电视机等终端,向用户提供信息和服务的传播形态;目前,主流的新媒体有微博、微信、今日头条、抖音等。
随着新媒体的快速发展,已成为众多机构、公司对外发布信息,与大家互动的主要平台。例如政务机构通过新媒体进行发布权威信息以及政民互动,新媒体的更新内容、更新频率以及互动时效将直接影响用户体验,因此需要对新媒体进行更新监测。
以政务机构为例,由于存在大量的政务机构,各政务机构均注册了不同类型的新媒体账号,针对数量庞大的新媒体账号,传统上仅通过人工抽检的方式进行更新监测,存在工作量巨大且容易遗漏的缺点。
因此,如何提供一种新媒体更新监测方法、系统、设备及介质,实现提升新媒体更新监测的效率以及质量,成为一个亟待解决的问题。
发明内容
本发明要解决的技术问题,在于提供一种新媒体更新监测方法、系统、设备及介质,实现提升新媒体更新监测的效率以及质量。
第一方面,本发明提供了一种新媒体更新监测方法,包括如下步骤:
步骤S10、创建一敏感词库以及一错别字词库,并设定一监测周期;
步骤S20、基于预设的各新媒体账号自动获取新媒体内容;
步骤S30、对所述新媒体内容进行格式转换和解析,得到结构化数据;
步骤S40、基于所述敏感词库、错别字词库以及监测周期对结构化数据进行监测,自动生成监测报告并进行存储。
进一步地,所述步骤S20具体为:
通过网络爬虫技术,基于预设的各新媒体账号定期自动获取新媒体内容;
所述新媒体内容至少包括文章标题、文章正文内容、文章地址、文章发布时间、账号昵称以及账号标识码。
进一步地,所述步骤S30具体为:
对所述新媒体内容的格式统一转换为HTML文件,并利用DOM解析技术解析各所述HTML文件得到结构化数据。
进一步地,所述步骤S40具体包括:
步骤S41、创建一至少包括新媒体账号、敏感词标识、错别字标识以及更新标识的监测报告;
步骤S42、判断当前时间与所述结构化数据携带的最新的文章发布时间的差值是否大于监测周期,若否,则在所述监测报告中,将新媒体账号对应的更新标识更新为正常更新;若是,则在所述监测报告中,将新媒体账号对应的更新标识更新为超时未更新;
判断所述结构化数据携带的文章标题以及文章正文内容是否包含敏感词库中的敏感词,若否,则在所述监测报告中,将新媒体账号对应的敏感词标识更新为不存在敏感词;若是,则在所述监测报告中,将新媒体账号对应的敏感词标识更新为存在敏感词;
判断所述结构化数据携带的文章标题以及文章正文内容是否包含错别字词库中的错别字,若否,则在所述监测报告中,将新媒体账号对应的错别字标识更新为不存在错别字;若是,则在所述监测报告中,将新媒体账号对应的错别字标识更新为存在错别字;
步骤S43、存储所述监测报告。
第二方面,本发明提供了一种新媒体更新监测系统,包括如下模块:
监测参数设定模块,用于创建一敏感词库以及一错别字词库,并设定一监测周期;
新媒体内容获取模块,用于基于预设的各新媒体账号自动获取新媒体内容;
格式转换和解析模块,用于对所述新媒体内容进行格式转换和解析,得到结构化数据;
监测模块,用于基于所述敏感词库、错别字词库以及监测周期对结构化数据进行监测,自动生成监测报告并进行存储。
进一步地,所述新媒体内容获取模块具体为:
通过网络爬虫技术,基于预设的各新媒体账号定期自动获取新媒体内容;
所述新媒体内容至少包括文章标题、文章正文内容、文章地址、文章发布时间、账号昵称以及账号标识码。
进一步地,所述格式转换和解析模块具体为:
对所述新媒体内容的格式统一转换为HTML文件,并利用DOM解析技术解析各所述HTML文件得到结构化数据。
进一步地,所述监测模块具体包括:
监测报告创建单元,用于创建一至少包括新媒体账号、敏感词标识、错别字标识以及更新标识的监测报告;
监测报告更新单元,用于判断当前时间与所述结构化数据携带的最新的文章发布时间的差值是否大于监测周期,若否,则在所述监测报告中,将新媒体账号对应的更新标识更新为正常更新;若是,则在所述监测报告中,将新媒体账号对应的更新标识更新为超时未更新;
判断所述结构化数据携带的文章标题以及文章正文内容是否包含敏感词库中的敏感词,若否,则在所述监测报告中,将新媒体账号对应的敏感词标识更新为不存在敏感词;若是,则在所述监测报告中,将新媒体账号对应的敏感词标识更新为存在敏感词;
判断所述结构化数据携带的文章标题以及文章正文内容是否包含错别字词库中的错别字,若否,则在所述监测报告中,将新媒体账号对应的错别字标识更新为不存在错别字;若是,则在所述监测报告中,将新媒体账号对应的错别字标识更新为存在错别字;
监测报告存储单元,用于存储所述监测报告。
第三方面,本发明提供了一种新媒体更新监测设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的方法。
第四方面,本发明提供了一种新媒体更新监测介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面所述的方法。
本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
通过自动获取各新媒体账号的新媒体内容,并对各新媒体内容进行格式转换和解析,便于批量的分析计算,再基于预设的监测周期、敏感词库以及错别字词库依次判断各新媒体内容是否超过监测周期未更新,是否存在敏感词,是否存在错别字,并自动更新至监测报告后进行存储,后期工作人员只需要查阅所述监测报告即可迅速判断各新媒体账号的更新情况,也避免了人工抽检而导致的遗漏,最终极大的提升了新媒体更新监测的效率以及质量。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
下面参照附图结合实施例对本发明作进一步的说明。
图1是本发明一种新媒体更新监测方法的流程图。
图2是本发明一种新媒体更新监测系统的结构示意图。
图3是本发明一种新媒体更新监测设备的结构示意图。
图4是本发明一种新媒体更新监测介质的结构示意图。
具体实施方式
本申请实施例通过提供一种新媒体更新监测方法、系统、设备及介质,实现提升新媒体更新监测的效率以及质量。
本申请实施例中的技术方案,总体思路如下:通过网络爬虫技术自动批量获取各新媒体账号的新媒体内容后进行格式转换和解析,再基于预设的监测周期、敏感词库以及错别字词库对新媒体内容进行自动监测,并自动更新存储监测报告,以提升新媒体更新监测的效率以及质量。
实施例一
本实施例提供一种新媒体更新监测方法,如图1所示,包括如下步骤:
步骤S10、创建一敏感词库以及一错别字词库,并设定一监测周期;例如将所述监测周期设为两周;
步骤S20、基于预设的各新媒体账号自动获取新媒体内容;
步骤S30、对所述新媒体内容进行格式转换和解析,得到结构化数据;
步骤S40、通过预设的脚本,基于所述敏感词库、错别字词库以及监测周期自动对结构化数据进行监测,自动生成监测报告并进行存储,便于后期溯源。
所述步骤S20具体为:
通过网络爬虫技术,基于预设的各新媒体账号定期自动获取新媒体内容;
所述新媒体内容至少包括文章标题、文章正文内容、文章地址、文章发布时间、账号昵称以及账号标识码。
所述步骤S30具体为:
对所述新媒体内容的格式统一转换为HTML文件,并利用DOM解析技术解析各所述HTML文件得到结构化数据。
所述步骤S40具体包括:
步骤S41、创建一至少包括新媒体账号、敏感词标识、错别字标识以及更新标识的监测报告;
步骤S42、判断当前时间与所述结构化数据携带的最新的文章发布时间的差值是否大于监测周期,若否,则在所述监测报告中,将新媒体账号对应的更新标识更新为正常更新;若是,则在所述监测报告中,将新媒体账号对应的更新标识更新为超时未更新;即超过两周未更新就将新媒体账号对应的更新标识更新为超时未更新,具体实施时也可将所述更新标识更新为具体未更新的天数;
判断所述结构化数据携带的文章标题以及文章正文内容是否包含敏感词库中的敏感词,若否,则在所述监测报告中,将新媒体账号对应的敏感词标识更新为不存在敏感词;若是,则在所述监测报告中,将新媒体账号对应的敏感词标识更新为存在敏感词;
判断所述结构化数据携带的文章标题以及文章正文内容是否包含错别字词库中的错别字,若否,则在所述监测报告中,将新媒体账号对应的错别字标识更新为不存在错别字;若是,则在所述监测报告中,将新媒体账号对应的错别字标识更新为存在错别字;
步骤S43、存储所述监测报告。
实施例二
本实施例提供一种新媒体更新监测系统,如图2所示,包括如下模块:
监测参数设定模块,用于创建一敏感词库以及一错别字词库,并设定一监测周期;例如将所述监测周期设为两周;
新媒体内容获取模块,用于基于预设的各新媒体账号自动获取新媒体内容;
格式转换和解析模块,用于对所述新媒体内容进行格式转换和解析,得到结构化数据;
监测模块,用于通过预设的脚本,基于所述敏感词库、错别字词库以及监测周期自动对结构化数据进行监测,自动生成监测报告并进行存储,便于后期溯源。
所述新媒体内容获取模块具体为:
通过网络爬虫技术,基于预设的各新媒体账号定期自动获取新媒体内容;
所述新媒体内容至少包括文章标题、文章正文内容、文章地址、文章发布时间、账号昵称以及账号标识码。
所述格式转换和解析模块具体为:
对所述新媒体内容的格式统一转换为HTML文件,并利用DOM解析技术解析各所述HTML文件得到结构化数据。
所述监测模块具体包括:
监测报告创建单元,用于创建一至少包括新媒体账号、敏感词标识、错别字标识以及更新标识的监测报告;
监测报告更新单元,用于判断当前时间与所述结构化数据携带的最新的文章发布时间的差值是否大于监测周期,若否,则在所述监测报告中,将新媒体账号对应的更新标识更新为正常更新;若是,则在所述监测报告中,将新媒体账号对应的更新标识更新为超时未更新;即超过两周未更新就将新媒体账号对应的更新标识更新为超时未更新,具体实施时也可将所述更新标识更新为具体未更新的天数;
判断所述结构化数据携带的文章标题以及文章正文内容是否包含敏感词库中的敏感词,若否,则在所述监测报告中,将新媒体账号对应的敏感词标识更新为不存在敏感词;若是,则在所述监测报告中,将新媒体账号对应的敏感词标识更新为存在敏感词;
判断所述结构化数据携带的文章标题以及文章正文内容是否包含错别字词库中的错别字,若否,则在所述监测报告中,将新媒体账号对应的错别字标识更新为不存在错别字;若是,则在所述监测报告中,将新媒体账号对应的错别字标识更新为存在错别字;
监测报告存储单元,用于存储所述监测报告。
基于同一发明构思,本申请提供了实施例一对应的电子设备实施例,详见实施例三。
实施例三
本实施例提供了一种新媒体更新监测设备,如图3所示,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,可以实现实施例一中任一实施方式。
由于本实施例所介绍的电子设备为实施本申请实施例一中方法所采用的设备,故而基于本申请实施例一中所介绍的方法,本领域所属技术人员能够了解本实施例的电子设备的具体实施方式以及其各种变化形式,所以在此对于该电子设备如何实现本申请实施例中的方法不再详细介绍。只要本领域所属技术人员实施本申请实施例中的方法所采用的设备,都属于本申请所欲保护的范围。
基于同一发明构思,本申请提供了实施例一对应的存储介质,详见实施例四。
实施例四
本实施例提供一种新媒体更新监测介质,如图4所示,其上存储有计算机程序,该计算机程序被处理器执行时,可以实现实施例一中任一实施方式。
本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
通过自动获取各新媒体账号的新媒体内容,并对各新媒体内容进行格式转换和解析,便于批量的分析计算,再基于预设的监测周期、敏感词库以及错别字词库依次判断各新媒体内容是否超过监测周期未更新,是否存在敏感词,是否存在错别字,并自动更新至监测报告后进行存储,后期工作人员只需要查阅所述监测报告即可迅速判断各新媒体账号的更新情况,也避免了人工抽检而导致的遗漏,最终极大的提升了新媒体更新监测的效率以及质量。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
虽然以上描述了本发明的具体实施方式,但是熟悉本技术领域的技术人员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本发明的范围的限定,熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化,都应当涵盖在本发明的权利要求所保护的范围内。
Claims (10)
1.一种新媒体更新监测方法,其特征在于:包括如下步骤:
步骤S10、创建一敏感词库以及一错别字词库,并设定一监测周期;
步骤S20、基于预设的各新媒体账号自动获取新媒体内容;
步骤S30、对所述新媒体内容进行格式转换和解析,得到结构化数据;
步骤S40、基于所述敏感词库、错别字词库以及监测周期对结构化数据进行监测,自动生成监测报告并进行存储。
2.如权利要求1所述的一种新媒体更新监测方法,其特征在于:所述步骤S20具体为:
通过网络爬虫技术,基于预设的各新媒体账号定期自动获取新媒体内容;
所述新媒体内容至少包括文章标题、文章正文内容、文章地址、文章发布时间、账号昵称以及账号标识码。
3.如权利要求1所述的一种新媒体更新监测方法,其特征在于:所述步骤S30具体为:
对所述新媒体内容的格式统一转换为HTML文件,并利用DOM解析技术解析各所述HTML文件得到结构化数据。
4.如权利要求2所述的一种新媒体更新监测方法,其特征在于:所述步骤S40具体包括:
步骤S41、创建一至少包括新媒体账号、敏感词标识、错别字标识以及更新标识的监测报告;
步骤S42、判断当前时间与所述结构化数据携带的最新的文章发布时间的差值是否大于监测周期,若否,则在所述监测报告中,将新媒体账号对应的更新标识更新为正常更新;若是,则在所述监测报告中,将新媒体账号对应的更新标识更新为超时未更新;
判断所述结构化数据携带的文章标题以及文章正文内容是否包含敏感词库中的敏感词,若否,则在所述监测报告中,将新媒体账号对应的敏感词标识更新为不存在敏感词;若是,则在所述监测报告中,将新媒体账号对应的敏感词标识更新为存在敏感词;
判断所述结构化数据携带的文章标题以及文章正文内容是否包含错别字词库中的错别字,若否,则在所述监测报告中,将新媒体账号对应的错别字标识更新为不存在错别字;若是,则在所述监测报告中,将新媒体账号对应的错别字标识更新为存在错别字;
步骤S43、存储所述监测报告。
5.一种新媒体更新监测系统,其特征在于:包括如下模块:
监测参数设定模块,用于创建一敏感词库以及一错别字词库,并设定一监测周期;
新媒体内容获取模块,用于基于预设的各新媒体账号自动获取新媒体内容;
格式转换和解析模块,用于对所述新媒体内容进行格式转换和解析,得到结构化数据;
监测模块,用于基于所述敏感词库、错别字词库以及监测周期对结构化数据进行监测,自动生成监测报告并进行存储。
6.如权利要求5所述的一种新媒体更新监测系统,其特征在于:所述新媒体内容获取模块具体为:
通过网络爬虫技术,基于预设的各新媒体账号定期自动获取新媒体内容;
所述新媒体内容至少包括文章标题、文章正文内容、文章地址、文章发布时间、账号昵称以及账号标识码。
7.如权利要求5所述的一种新媒体更新监测系统,其特征在于:所述格式转换和解析模块具体为:
对所述新媒体内容的格式统一转换为HTML文件,并利用DOM解析技术解析各所述HTML文件得到结构化数据。
8.如权利要求6所述的一种新媒体更新监测系统,其特征在于:所述监测模块具体包括:
监测报告创建单元,用于创建一至少包括新媒体账号、敏感词标识、错别字标识以及更新标识的监测报告;
监测报告更新单元,用于判断当前时间与所述结构化数据携带的最新的文章发布时间的差值是否大于监测周期,若否,则在所述监测报告中,将新媒体账号对应的更新标识更新为正常更新;若是,则在所述监测报告中,将新媒体账号对应的更新标识更新为超时未更新;
判断所述结构化数据携带的文章标题以及文章正文内容是否包含敏感词库中的敏感词,若否,则在所述监测报告中,将新媒体账号对应的敏感词标识更新为不存在敏感词;若是,则在所述监测报告中,将新媒体账号对应的敏感词标识更新为存在敏感词;
判断所述结构化数据携带的文章标题以及文章正文内容是否包含错别字词库中的错别字,若否,则在所述监测报告中,将新媒体账号对应的错别字标识更新为不存在错别字;若是,则在所述监测报告中,将新媒体账号对应的错别字标识更新为存在错别字;
监测报告存储单元,用于存储所述监测报告。
9.一种新媒体更新监测设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至4任一项所述的方法。
10.一种新媒体更新监测介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至4任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110799736.XA CN113672587A (zh) | 2021-07-15 | 2021-07-15 | 一种新媒体更新监测方法、系统、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110799736.XA CN113672587A (zh) | 2021-07-15 | 2021-07-15 | 一种新媒体更新监测方法、系统、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113672587A true CN113672587A (zh) | 2021-11-19 |
Family
ID=78539191
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110799736.XA Pending CN113672587A (zh) | 2021-07-15 | 2021-07-15 | 一种新媒体更新监测方法、系统、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113672587A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115186657A (zh) * | 2022-07-28 | 2022-10-14 | 北京网景盛世技术开发中心 | 错敏信息检测方法、装置、计算机设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104504081A (zh) * | 2014-12-25 | 2015-04-08 | 北京东方剪报国际信息咨询有限公司 | 全媒体检测及监播大数据行为智能分析系统 |
CN107679036A (zh) * | 2017-10-12 | 2018-02-09 | 南京网数信息科技有限公司 | 一种错别字监测方法及系统 |
CN109450874A (zh) * | 2018-10-23 | 2019-03-08 | 北京点网聚科技有限公司 | 用户账号监控方法及装置 |
US20190179957A1 (en) * | 2017-12-12 | 2019-06-13 | Promontory Financial Group Llc | Monitoring updates to a document based on contextual data |
CN110598075A (zh) * | 2019-08-21 | 2019-12-20 | 成都信息工程大学 | 一种基于人工智能的互联网媒体内容安全监测系统及方法 |
CN112434226A (zh) * | 2020-12-15 | 2021-03-02 | 易研信息科技有限公司 | 一种网络舆情监测预警方法 |
-
2021
- 2021-07-15 CN CN202110799736.XA patent/CN113672587A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104504081A (zh) * | 2014-12-25 | 2015-04-08 | 北京东方剪报国际信息咨询有限公司 | 全媒体检测及监播大数据行为智能分析系统 |
CN107679036A (zh) * | 2017-10-12 | 2018-02-09 | 南京网数信息科技有限公司 | 一种错别字监测方法及系统 |
US20190179957A1 (en) * | 2017-12-12 | 2019-06-13 | Promontory Financial Group Llc | Monitoring updates to a document based on contextual data |
CN109450874A (zh) * | 2018-10-23 | 2019-03-08 | 北京点网聚科技有限公司 | 用户账号监控方法及装置 |
CN110598075A (zh) * | 2019-08-21 | 2019-12-20 | 成都信息工程大学 | 一种基于人工智能的互联网媒体内容安全监测系统及方法 |
CN112434226A (zh) * | 2020-12-15 | 2021-03-02 | 易研信息科技有限公司 | 一种网络舆情监测预警方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115186657A (zh) * | 2022-07-28 | 2022-10-14 | 北京网景盛世技术开发中心 | 错敏信息检测方法、装置、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20140009297A (ko) | 예시에 의한 데이터 포매팅 | |
CN111585344B (zh) | 一种基于全站ied仿真的变电站智能校核方法及装置 | |
CN112925757A (zh) | 一种追踪智能设备操作日志的方法、设备、存储介质 | |
CN113672587A (zh) | 一种新媒体更新监测方法、系统、设备及介质 | |
CN112083926A (zh) | 一种Web用户界面生成方法及装置 | |
CN109240916B (zh) | 信息输出控制方法、装置及计算机可读存储介质 | |
CN110716804A (zh) | 无用资源的自动删除方法、装置、存储介质及电子设备 | |
CN110287182B (zh) | 一种大数据的数据对比方法、装置、设备及终端 | |
CN109068286B (zh) | 一种信息解析的方法、介质及设备 | |
CN115271764B (zh) | 一种用于智能手机维修的安全管控方法及系统 | |
CN116360787A (zh) | 表格代码自动生成方法、装置、电子设备及存储介质 | |
CN115934199A (zh) | 服务性能监控工具、方法、设备及介质 | |
CN111488286B (zh) | 一种Android模块独立开发的方法及装置 | |
CN111352824B (zh) | 测试方法、装置及计算机设备 | |
CN109359384B (zh) | 一种将丝印标识调入印刷电路板的方法及装置 | |
CN114253441A (zh) | 目标功能的启用方法及装置、存储介质、电子装置 | |
CN114020565A (zh) | 日志智能采集处理方法、装置、电子设备及存储介质 | |
CN109509467B (zh) | 代码生成方法及装置 | |
CN108415814B (zh) | 自动记录字段变化方法、应用服务器及计算机可读存储介质 | |
CN103491234A (zh) | 一种数据处理的方法及一种电子设备 | |
CN112231185A (zh) | 基于应用系统告警信息的知识获取方法及装置 | |
CN111459583A (zh) | 一种菜单创建方法及装置 | |
CN112181486A (zh) | 一种数据处理的方法、装置和存储介质 | |
CN116483834A (zh) | 数据索引添加方法及装置、存储介质、计算机设备 | |
CN114218080A (zh) | 一种产出物数据复用方法、装置、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |