CN114661934B - 基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法 - Google Patents

基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法 Download PDF

Info

Publication number
CN114661934B
CN114661934B CN202210276570.8A CN202210276570A CN114661934B CN 114661934 B CN114661934 B CN 114661934B CN 202210276570 A CN202210276570 A CN 202210276570A CN 114661934 B CN114661934 B CN 114661934B
Authority
CN
China
Prior art keywords
public opinion
key
words
handheld terminal
mobile intelligent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210276570.8A
Other languages
English (en)
Other versions
CN114661934A (zh
Inventor
李翔
赵根
闫亮
王彦集
严彦
黄九松
侯伟
胡源
周宏文
徐文君
蒋正坤
王雪
郑翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Planning And Natural Resources Information Center
Original Assignee
Chongqing Planning And Natural Resources Information Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Planning And Natural Resources Information Center filed Critical Chongqing Planning And Natural Resources Information Center
Priority to CN202210276570.8A priority Critical patent/CN114661934B/zh
Publication of CN114661934A publication Critical patent/CN114661934A/zh
Application granted granted Critical
Publication of CN114661934B publication Critical patent/CN114661934B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Educational Administration (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出了一种基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法,包括以下步骤:S1,获取图像文件,根据获取的图像文件提取图像文件中的文字数据;S2,获取舆情警示词数据库,对获取的舆情警示词进行分组,对每组舆情警示词设置一个舆情中心警示词作为标准舆情词,将标准舆情词作为起始节点,设置其它相近舆情词到标准舆情词的距离小于预设距离阈值,将其相近舆情词分为同一组;S3,根据步骤S1中提取的文字数据识别出舆情警示词。本发明能够实现对政府平台上收集的文字信息进行舆情监测。

Description

基于数据挖掘分析技术多维度监控政务新媒体舆情预警的 方法
技术领域
本发明涉及一种政务舆情技术领域,特别是涉及一种基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法。
背景技术
舆情监测是一项交叉了社会科学和数据科学的复杂技术,需要在舆情发生初期对事件有个初步的预判,充分做好应对准备。针对舆情事件的描述,主要来自网络媒体上的新闻文本和类似新浪微博的社交平台,人们通过阅读、转发、评论等,直接告知他人或者从他人那里间接了解到舆情事件的相关信息。
发明内容
本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法。
为了实现本发明的上述目的,本发明提供了一种基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法,包括以下步骤:
S1,获取图像文件,根据获取的图像文件提取图像文件中的文字数据;
S2,获取舆情警示词数据库,对获取的舆情警示词进行分组,对每组舆情警示词设置一个舆情中心警示词作为标准舆情词,将标准舆情词作为起始节点,设置其它相近舆情词到标准舆情词的距离小于预设距离阈值,将其相近舆情词分为同一组;
S3,根据步骤S1中提取的文字数据识别出舆情警示词。
在本发明的一种优选实施方式中,图像文件的格式包括bmp、jpg、png、tif、gif之一或者任意组合。
在本发明的一种优选实施方式中,在步骤S1中根据获取的图像文件提取图像文件中的文字数据的方法包括以下步骤:
S11,令λ=1;
S12,对第λ图像进行操作:
w=N/(P×Q),
其中,Q表示第λ图像的高度;
P表示第λ图像的宽度;
w表示像素目标点的总像素个数与第λ图像的比数;
N表示图像分离阈值H大于或者等于提取第λ图像中的灰度值的个数;
S13,w′=(-N+P×Q)/P×Q,
w′表示像素背景点的总像素个数与第λ图像的比数;
其中,ζ表示目标图像的灰度平均值;
Ai∈A={A1,A2,A3,...,AN,AN+1},
其中,A表示目标图像中的所有像素点的灰度值集;
Ai表示目标图像中的第i个像素点的灰度值;
S14,
其中,ξ表示背景图像的灰度平均值;
Bj∈B={B1,B2,B3,…,BP×Q-N,BP×Q-N+1},
其中,B表示背景图像中的所有像素点的灰度值集;
Bj表示背景图像中的第j个像素点的灰度值;
S15,
其中,表示提取第λ图像的灰度平均值;
S16,
其中,η表示图像方差灰度值;
使用遍历方法让图像方差灰度值最大ηmax时,得到图像分离阈值H;
S17,判定图像分离阈值H与提取第λ图像中的第k个像素点灰度值Iλ,k的关系大小:
若Iλ,k≤H,则令Iλ,k=255;
若Iλ,k>H,则令Iλ,k=0;k=1,2,3,…,P×Q;
S18,提取第λ图像中的目标图像中的文字;
S19,判断λ与间的关系大小:
表示图像文件中图像的总张数;则结束;
则λ=λ+1,返回步骤S12。
在本发明的一种优选实施方式中,在步骤S2中,相近舆情词到标准舆情词的距离的计算方法为:
其中,aij表示相近舆情词在特征点(i,j)处的词性值;
I表示相近舆情词中每行特征点的总个数;
J表示相近舆情词中每列特征点的总个数;
表示相近舆情词的系数;/>
bij表示标准舆情词在特征点(i,j)处的词性值;
I′表示标准舆情词中每行特征点的总个数;
J′表示标准舆情词中每列特征点的总个数;
φ表示标准舆情词的系数;φ∈(0,1)。
在本发明的一种优选实施方式中,还包括步骤S4,通过移动智能手持终端登录查看识别出的舆情警示词。
本发明还公开了一种基于数据挖掘分析技术多维度监控政务新媒体舆情预警的系统,包括获取提取模块、分组模块和识别模块;
获取提取模块的数据输出端与分组模块的数据输入端相连,分组模块的数据输出端与识别模块的数据输入端相连;
获取提取模块用于获取图像文件,根据获取的图像文件提取图像文件中的文字数据;
分组模块用于获取舆情警示词数据库,对获取的舆情警示词进行分组,对每组舆情警示词设置一个舆情中心警示词作为标准舆情词,将标准舆情词作为起始节点,设置其它相近舆情词到标准舆情词的距离小于预设距离阈值,将其相近舆情词分为同一组;
识别模块用于根据获取提取模块中提取的文字数据识别出舆情警示词。
在本发明的一种优选实施方式中,图像文件的格式包括bmp、jpg、png、tif、gif之一或者任意组合。
在本发明的一种优选实施方式中,在步骤S1中根据获取的图像文件提取图像文件中的文字数据的方法包括以下步骤:
S11,令λ=1;
S12,对第λ图像进行操作:
w=N/(P×Q),
其中,Q表示第λ图像的高度;
P表示第λ图像的宽度;
w表示像素目标点的总像素个数与第λ图像的比数;
N表示图像分离阈值H大于或者等于提取第λ图像中的灰度值的个数;
S13,w′=(-N+P×Q)/P×Q,
w′表示像素背景点的总像素个数与第λ图像的比数;
其中,ζ表示目标图像的灰度平均值;
Ai∈A={A1,A2,A3,…,AN,AN+1},
其中,A表示目标图像中的所有像素点的灰度值集;
Ai表示目标图像中的第i个像素点的灰度值;
S14,
其中,ξ表示背景图像的灰度平均值;
Bj∈B={B1,B2,B3,…,BP×Q-N,BP×Q-N+1},
其中,B表示背景图像中的所有像素点的灰度值集;
Bj表示背景图像中的第j个像素点的灰度值;
S15,
其中,表示提取第λ图像的灰度平均值;
S16,
其中,η表示图像方差灰度值;
使用遍历方法让图像方差灰度值最大ηmax时,得到图像分离阈值H;
S17,判定图像分离阈值H与提取第λ图像中的第k个像素点灰度值Iλ,k的关系大小:
若Iλ,k≤H,则令Iλ,k=255;
若Iλ,k>H,则令Iλ,k=0;k=1,2,3,…,P×Q;
S18,提取第λ图像中的目标图像中的文字;
S19,判断λ与间的关系大小:
表示图像文件中图像的总张数;则结束;
则λ=λ+1,返回步骤S12。
在本发明的一种优选实施方式中,在步骤S2中,相近舆情词到标准舆情词的距离的计算方法为:
其中,aij表示相近舆情词在特征点(i,j)处的词性值;
I表示相近舆情词中每行特征点的总个数;
J表示相近舆情词中每列特征点的总个数;
表示相近舆情词的系数;/>
bij表示标准舆情词在特征点(i,j)处的词性值;
I′表示标准舆情词中每行特征点的总个数;
J′表示标准舆情词中每列特征点的总个数;
φ表示标准舆情词的系数;φ∈(0,1)。
在本发明的一种优选实施方式中,还包括登录查看模块,登录查看模块用于通过移动智能手持终端登录查看识别出的舆情警示词。
综上所述,由于采用了上述技术方案,本发明能够实现对政府平台上收集的文字信息进行舆情监测。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明流程示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
本发明提供了一种基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法,如图1所示,包括以下步骤:
S1,获取图像文件,根据获取的图像文件提取图像文件中的文字数据;
S2,获取舆情警示词数据库,对获取的舆情警示词进行分组,对每组舆情警示词设置一个舆情中心警示词作为标准舆情词,将标准舆情词作为起始节点,设置其它相近舆情词到标准舆情词的距离小于预设距离阈值,将其相近舆情词分为同一组;
S3,根据步骤S1中提取的文字数据识别出舆情警示词。
在本发明的一种优选实施方式中,图像文件的格式包括bmp、jpg、png、tif、gif之一或者任意组合。
在本发明的一种优选实施方式中,在步骤S1中根据获取的图像文件提取图像文件中的文字数据的方法包括以下步骤:
S11,令λ=1;
S12,对第λ图像进行操作:
w=N/(P×Q),
其中,Q表示第λ图像的高度;
P表示第λ图像的宽度;
w表示像素目标点的总像素个数与第λ图像的比数;
N表示图像分离阈值H大于或者等于提取第λ图像中的灰度值的个数;
S13,w′=(-N+P×Q)/P×Q,
w′表示像素背景点的总像素个数与第λ图像的比数;
其中,ζ表示目标图像的灰度平均值;
Ai∈A={A1,A2,A3,...,AN,AN+1},
其中,A表示目标图像中的所有像素点的灰度值集;
Ai表示目标图像中的第i个像素点的灰度值;
S14,
其中,ξ表示背景图像的灰度平均值;
Bj∈B={B1,B2,B3,...,BP×Q-N,BP×Q-N+1},
其中,B表示背景图像中的所有像素点的灰度值集;
Bj表示背景图像中的第j个像素点的灰度值;
S15,
其中,表示提取第λ图像的灰度平均值;
S16,
其中,η表示图像方差灰度值;
使用遍历方法让图像方差灰度值最大ηmax时,得到图像分离阈值H;
S17,判定图像分离阈值H与提取第λ图像中的第k个像素点灰度值Iλ,k的关系大小:
若Iλ,k≤H,则令Iλ,k=255;
若Iλ,k>H,则令Iλ,k=0;k=1,2,3,...,P×Q;
S18,提取第λ图像中的目标图像中的文字;
S19,判断λ与间的关系大小:
表示图像文件中图像的总张数;则结束;
则λ=λ+1,返回步骤S12。
在本发明的一种优选实施方式中,在步骤S2中,相近舆情词到标准舆情词的距离的计算方法为:
其中,aij表示相近舆情词在特征点(i,j)处的词性值;
I表示相近舆情词中每行特征点的总个数;
J表示相近舆情词中每列特征点的总个数;
表示相近舆情词的系数;/>
bij表示标准舆情词在特征点(i,j)处的词性值;
I′表示标准舆情词中每行特征点的总个数;
J′表示标准舆情词中每列特征点的总个数;
φ表示标准舆情词的系数;φ∈(0,1)。
在本发明的一种优选实施方式中,还包括步骤S4,通过移动智能手持终端登录查看识别出的舆情警示词。通过移动智能手持终端登录服务器端的方法包括以下步骤:
S41,服务器端获取得到SM4对称秘钥SM4_KEY,移动智能手持终端获取得到通讯标识TK;服务器端获取得到SM4对称秘钥SM4_KEY,移动智能手持终端获取得到通讯标识TK的方法包括以下步骤:
S411,移动智能手持终端向服务器端发送获取SM2公钥请求,在服务器端上存放有SM2公钥SM2_PUBKEY和SM2私钥SM2_PRIKEY对;
S412,服务器端接收到移动智能手持终端发送的SM2公钥请求后,将SM2公钥SM2_PUBKEY以明文形式返回给移动智能手持终端;
S413,移动智能手持终端接收到服务器端发送的SM2公钥SM2_PUBKEY后,生成一个SM4对称秘钥SM4_KEY;
S414,使用SM2公钥SM2_PUBKEY对SM4对称秘钥SM4_KEY做SM2加密得到密文ENSM4K,并发送密文ENSM4K给服务器端;
S415,服务器端接收到移动智能手持终端发送的密文ENSM4K后,用SM2私钥SM2_PRIKEY对接收到的密文ENSM4K进行解密,解密后得到SM4对称秘钥SM4_KEY,同时生成一个通讯标识TK;
S416,将通讯标识TK与SM4对称秘钥SM4_KEY建立关联形成KV键值对存储在缓存服务器端redis中;用SM4对称秘钥SM4_KEY对通讯标识TK进行SM4对称加密,得到加密标识ENTK,返回给移动智能手持终端;
S417,移动智能手持终端用SM4对称秘钥SM4_KEY对接收到的加密标识ENTK进行SM4对称解密得到通讯标识TK。SM4对称秘钥SM4_KEY具有时效性,可以是一小时、一天、一个月等,过期后更新SM4对称秘钥SM4_KEY,为了更加安全,服务器端也可以同时更新SM2公钥SM2_PUBKEY和SM2私钥SM2_PRIKEY对。
S42,移动智能手持终端对获取的用户名和密码分别利用SM4对称秘钥SM4_KEY进行加密,得到其加密用户名和加密密码;移动智能手持终端将其加密用户名和加密密码以及通讯标识TK发送至服务器端;
S43,服务器端接收到移动智能手持终端发送的加密用户名和加密密码以及通讯标识TK后,根据通讯标识TK从缓存服务器端redis中获取通讯标识TK所对应的SM4对称秘钥SM4_KEY;
S44,服务器端利用步骤S43中得到的SM4对称秘钥SM4_KEY对加密用户名和加密密码进行解密,得到其解密用户名和解密密码;验证通过后,移动智能手持终端登录服务器端成功。
本发明还公开了一种基于数据挖掘分析技术多维度监控政务新媒体舆情预警的系统,包括获取提取模块、分组模块和识别模块;
获取提取模块的数据输出端与分组模块的数据输入端相连,分组模块的数据输出端与识别模块的数据输入端相连;
获取提取模块用于获取图像文件,根据获取的图像文件提取图像文件中的文字数据;
分组模块用于获取舆情警示词数据库,对获取的舆情警示词进行分组,对每组舆情警示词设置一个舆情中心警示词作为标准舆情词,将标准舆情词作为起始节点,设置其它相近舆情词到标准舆情词的距离小于预设距离阈值,将其相近舆情词分为同一组;
识别模块用于根据获取提取模块中提取的文字数据识别出舆情警示词。
在本发明的一种优选实施方式中,图像文件的格式包括bmp、jpg、png、tif、gif之一或者任意组合。
在本发明的一种优选实施方式中,在步骤S1中根据获取的图像文件提取图像文件中的文字数据的方法包括以下步骤:
S11,令λ=1;
S12,对第λ图像进行操作:
w=N/(P×Q),
其中,Q表示第λ图像的高度;
P表示第λ图像的宽度;
w表示像素目标点的总像素个数与第λ图像的比数;
N表示图像分离阈值H大于或者等于提取第λ图像中的灰度值的个数;
S13,w′=(-N+P×Q)/P×Q,
w′表示像素背景点的总像素个数与第λ图像的比数;
其中,ζ表示目标图像的灰度平均值;
Ai∈A={A1,A2,A3,...,AN,AN+1},
其中,A表示目标图像中的所有像素点的灰度值集;
Ai表示目标图像中的第i个像素点的灰度值;
S14,
其中,ξ表示背景图像的灰度平均值;
Bj∈B={B1,B2,B3,...,BP×Q-N,BP×Q-N+1},
其中,B表示背景图像中的所有像素点的灰度值集;
Bj表示背景图像中的第j个像素点的灰度值;
S15,
其中,表示提取第λ图像的灰度平均值;
S16,
其中,η表示图像方差灰度值;
使用遍历方法让图像方差灰度值最大ηmax时,得到图像分离阈值H;
S17,判定图像分离阈值H与提取第λ图像中的第k个像素点灰度值Iλ,k的关系大小:
若Iλ,k≤H,则令Iλ,k=255;
若Iλ,k>H,则令Iλ,k=0;k=1,2,3,...,P×Q;
S18,提取第λ图像中的目标图像中的文字;
S19,判断λ与间的关系大小:
表示图像文件中图像的总张数;则结束;
则λ=λ+1,返回步骤S12。
在本发明的一种优选实施方式中,在步骤S2中,相近舆情词到标准舆情词的距离的计算方法为:
其中,aij表示相近舆情词在特征点(i,j)处的词性值;
I表示相近舆情词中每行特征点的总个数;
J表示相近舆情词中每列特征点的总个数;
表示相近舆情词的系数;/>
bij表示标准舆情词在特征点(i,j)处的词性值;
I′表示标准舆情词中每行特征点的总个数;
J′表示标准舆情词中每列特征点的总个数;
φ表示标准舆情词的系数;φ∈(0,1)。
在本发明的一种优选实施方式中,还包括登录查看模块,登录查看模块用于通过移动智能手持终端登录查看识别出的舆情警示词。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (4)

1.一种基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法,其特征在于,包括以下步骤:
S1,获取图像文件,根据获取的图像文件提取图像文件中的文字数据;
S2,获取舆情警示词数据库,对获取的舆情警示词进行分组,对每组舆情警示词设置一个舆情中心警示词作为标准舆情词,将标准舆情词作为起始节点,设置其它相近舆情词到标准舆情词的距离小于预设距离阈值,将其相近舆情词分为同一组;
其中,相近舆情词到标准舆情词的距离的计算方法为:
其中,aij表示相近舆情词在特征点(i,j)处的词性值;
I表示相近舆情词中每行特征点的总个数;
J表示相近舆情词中每列特征点的总个数;
表示相近舆情词的系数;/>
bij表示标准舆情词在特征点(i,j)处的词性值;
I′表示标准舆情词中每行特征点的总个数;
J′表示标准舆情词中每列特征点的总个数;
φ表示标准舆情词的系数;φ∈(0,1);
S3,根据步骤S1中提取的文字数据通过步骤S2中的舆情警示词数据库识别出舆情警示词;
S4,通过移动智能手持终端登录查看识别出的舆情警示词,通过移动智能手持终端登录服务器端的方法包括以下步骤:
S41,服务器端获取得到SM4对称秘钥SM4_KEY,移动智能手持终端获取得到通讯标识TK;服务器端获取得到SM4对称秘钥SM4_KEY,移动智能手持终端获取得到通讯标识TK的方法包括以下步骤:
S411,移动智能手持终端向服务器端发送获取SM2公钥请求,在服务器端上存放有SM2公钥SM2_PUBKEY和SM2私钥SM2_PRIKEY对;
S412,服务器端接收到移动智能手持终端发送的SM2公钥请求后,将SM2公钥SM2_PUBKEY以明文形式返回给移动智能手持终端;
S413,移动智能手持终端接收到服务器端发送的SM2公钥SM2_PUBKEY后,生成一个SM4对称秘钥SM4_KEY;
S414,使用SM2公钥SM2_PUBKEY对SM4对称秘钥SM4_KEY做SM2加密得到密文ENSM4K,并发送密文ENSM4K给服务器端;
S415,服务器端接收到移动智能手持终端发送的密文ENSM4K后,用SM2私钥SM2_PRIKEY对接收到的密文ENSM4K进行解密,解密后得到SM4对称秘钥SM4_KEY,同时生成一个通讯标识TK;
S416,将通讯标识TK与SM4对称秘钥SM4_KEY建立关联形成KV键值对存储在缓存服务器端redis中;用SM4对称秘钥SM4_KEY对通讯标识TK进行SM4对称加密,得到加密标识ENTK,返回给移动智能手持终端;
S417,移动智能手持终端用SM4对称秘钥SM4_KEY对接收到的加密标识ENTK进行SM4对称解密得到通讯标识TK;
S42,移动智能手持终端对获取的用户名和密码分别利用SM4对称秘钥SM4_KEY进行加密,得到其加密用户名和加密密码;移动智能手持终端将其加密用户名和加密密码以及通讯标识TK发送至服务器端;
S43,服务器端接收到移动智能手持终端发送的加密用户名和加密密码以及通讯标识TK后,根据通讯标识TK从缓存服务器端redis中获取通讯标识TK所对应的SM4对称秘钥SM4_KEY;
S44,服务器端利用步骤S43中得到的SM4对称秘钥SM4_KEY对加密用户名和加密密码进行解密,得到其解密用户名和解密密码;验证通过后,移动智能手持终端登录服务器端成功。
2.根据权利要求1所述的基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法,其特征在于,图像文件的格式包括bmp、jpg、png、tif、gif之一或者任意组合。
3.一种基于数据挖掘分析技术多维度监控政务新媒体舆情预警的系统,其特征在于,包括获取提取模块、分组模块和识别模块;
获取提取模块的数据输出端与分组模块的数据输入端相连,分组模块的数据输出端与识别模块的数据输入端相连;
获取提取模块用于获取图像文件,根据获取的图像文件提取图像文件中的文字数据;
分组模块用于获取舆情警示词数据库,对获取的舆情警示词进行分组,对每组舆情警示词设置一个舆情中心警示词作为标准舆情词,将标准舆情词作为起始节点,设置其它相近舆情词到标准舆情词的距离小于预设距离阈值,将其相近舆情词分为同一组;
其中,相近舆情词到标准舆情词的距离的计算方法为:
其中,aij表示相近舆情词在特征点(i,j)处的词性值;
I表示相近舆情词中每行特征点的总个数;
J表示相近舆情词中每列特征点的总个数;
表示相近舆情词的系数;/>
bij表示标准舆情词在特征点(i,j)处的词性值;
I′表示标准舆情词中每行特征点的总个数;
J′表示标准舆情词中每列特征点的总个数;
φ表示标准舆情词的系数;φ∈(0,1);
识别模块用于根据获取提取模块中提取的文字数据通过分组模块中的舆情警示词数据库识别出舆情警示词;
还包括登录查看模块,登录查看模块用于通过移动智能手持终端登录查看识别出的舆情警示词,通过移动智能手持终端登录服务器端的方法包括以下步骤:
S41,服务器端获取得到SM4对称秘钥SM4_KEY,移动智能手持终端获取得到通讯标识TK;服务器端获取得到SM4对称秘钥SM4_KEY,移动智能手持终端获取得到通讯标识TK的方法包括以下步骤:
S411,移动智能手持终端向服务器端发送获取SM2公钥请求,在服务器端上存放有SM2公钥SM2_PUBKEY和SM2私钥SM2_PRIKEY对;
S412,服务器端接收到移动智能手持终端发送的SM2公钥请求后,将SM2公钥SM2_PUBKEY以明文形式返回给移动智能手持终端;
S413,移动智能手持终端接收到服务器端发送的SM2公钥SM2_PUBKEY后,生成一个SM4对称秘钥SM4_KEY;
S414,使用SM2公钥SM2_PUBKEY对SM4对称秘钥SM4_KEY做SM2加密得到密文ENSM4K,并发送密文ENSM4K给服务器端;
S415,服务器端接收到移动智能手持终端发送的密文ENSM4K后,用SM2私钥SM2_PRIKEY对接收到的密文ENSM4K进行解密,解密后得到SM4对称秘钥SM4_KEY,同时生成一个通讯标识TK;
S416,将通讯标识TK与SM4对称秘钥SM4_KEY建立关联形成KV键值对存储在缓存服务器端redis中;用SM4对称秘钥SM4_KEY对通讯标识TK进行SM4对称加密,得到加密标识ENTK,返回给移动智能手持终端;
S417,移动智能手持终端用SM4对称秘钥SM4_KEY对接收到的加密标识ENTK进行SM4对称解密得到通讯标识TK;
S42,移动智能手持终端对获取的用户名和密码分别利用SM4对称秘钥SM4_KEY进行加密,得到其加密用户名和加密密码;移动智能手持终端将其加密用户名和加密密码以及通讯标识TK发送至服务器端;
S43,服务器端接收到移动智能手持终端发送的加密用户名和加密密码以及通讯标识TK后,根据通讯标识TK从缓存服务器端redis中获取通讯标识TK所对应的SM4对称秘钥SM4_KEY;
S44,服务器端利用步骤S43中得到的SM4对称秘钥SM4_KEY对加密用户名和加密密码进行解密,得到其解密用户名和解密密码;验证通过后,移动智能手持终端登录服务器端成功。
4.根据权利要求3所述的基于数据挖掘分析技术多维度监控政务新媒体舆情预警的系统,其特征在于,图像文件的格式包括bmp、jpg、png、tif、gif之一或者任意组合。
CN202210276570.8A 2022-03-21 2022-03-21 基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法 Active CN114661934B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210276570.8A CN114661934B (zh) 2022-03-21 2022-03-21 基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210276570.8A CN114661934B (zh) 2022-03-21 2022-03-21 基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法

Publications (2)

Publication Number Publication Date
CN114661934A CN114661934A (zh) 2022-06-24
CN114661934B true CN114661934B (zh) 2024-03-01

Family

ID=82032304

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210276570.8A Active CN114661934B (zh) 2022-03-21 2022-03-21 基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法

Country Status (1)

Country Link
CN (1) CN114661934B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109600233A (zh) * 2019-01-15 2019-04-09 西安电子科技大学 基于sm2数字签名算法的群签名标识签发方法
KR20190046104A (ko) * 2017-10-25 2019-05-07 (주)다래전략사업화센터 특허 빅데이터 분석 방법론을 활용한 기술 융합형 디자인 솔루션 비즈니스 모델
CN110163013A (zh) * 2019-05-22 2019-08-23 上海上湖信息技术有限公司 一种检测敏感信息的方法和设备
CN110929683A (zh) * 2019-12-09 2020-03-27 北京赋乐科技有限公司 一种基于人工智能的视频舆情监测方法及系统
CN111191695A (zh) * 2019-12-19 2020-05-22 杭州安恒信息技术股份有限公司 一种基于深度学习的网站图片篡改检测方法
CN112887080A (zh) * 2020-09-04 2021-06-01 深圳奥联信息安全技术有限公司 基于sm2的密钥生成方法及系统
CN113128209A (zh) * 2021-04-22 2021-07-16 百度在线网络技术(北京)有限公司 用于生成词库的方法及装置
CN113220533A (zh) * 2021-05-21 2021-08-06 南京诺迈特网络科技有限公司 一种网络舆情监控方法及系统
CN113505387A (zh) * 2021-08-02 2021-10-15 合肥金瀚科技有限公司 一种量子秘钥生成终端系统
CN113918979A (zh) * 2021-10-29 2022-01-11 西安邮电大学 基于移动key密钥保护技术的sm2签名方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190046104A (ko) * 2017-10-25 2019-05-07 (주)다래전략사업화센터 특허 빅데이터 분석 방법론을 활용한 기술 융합형 디자인 솔루션 비즈니스 모델
CN109600233A (zh) * 2019-01-15 2019-04-09 西安电子科技大学 基于sm2数字签名算法的群签名标识签发方法
CN110163013A (zh) * 2019-05-22 2019-08-23 上海上湖信息技术有限公司 一种检测敏感信息的方法和设备
CN110929683A (zh) * 2019-12-09 2020-03-27 北京赋乐科技有限公司 一种基于人工智能的视频舆情监测方法及系统
CN111191695A (zh) * 2019-12-19 2020-05-22 杭州安恒信息技术股份有限公司 一种基于深度学习的网站图片篡改检测方法
CN112887080A (zh) * 2020-09-04 2021-06-01 深圳奥联信息安全技术有限公司 基于sm2的密钥生成方法及系统
CN113128209A (zh) * 2021-04-22 2021-07-16 百度在线网络技术(北京)有限公司 用于生成词库的方法及装置
CN113220533A (zh) * 2021-05-21 2021-08-06 南京诺迈特网络科技有限公司 一种网络舆情监控方法及系统
CN113505387A (zh) * 2021-08-02 2021-10-15 合肥金瀚科技有限公司 一种量子秘钥生成终端系统
CN113918979A (zh) * 2021-10-29 2022-01-11 西安邮电大学 基于移动key密钥保护技术的sm2签名方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
刘树春等.基于深度学习的文字识别.《深度实践OCR基于深度学习的文字识别》.2020, *
吴良斌.SAR图像处理与目标识别.《SAR图像处理与目标识别》.2013, *
张明书等.《基于安卓系统的隐私保护技术》.西安电子科技大学出版社,2021,66-68. *

Also Published As

Publication number Publication date
CN114661934A (zh) 2022-06-24

Similar Documents

Publication Publication Date Title
US10181168B2 (en) Personal safety verification system and similarity search method for data encrypted for confidentiality
CN1860724B (zh) 用于标识的方法
US10621440B2 (en) Network switching appliance, process and system for performing visual analytics for a streaming video
US7017182B2 (en) Method of securely transmitting information
US8700912B2 (en) Identification based on encrypted biometric data
CN103514286A (zh) 好友推荐系统及方法
CN113656661B (zh) 基于自然语言识别的移动政务系统
CN111062043B (zh) 基于边缘计算的医疗影像识别方法及系统
CN113870999B (zh) 基于算法、医学影像和区块链的远程疾病智能诊断系统和辅助诊断方法
CN115761840A (zh) 基于大数据平台下的人脸识别保护系统
CN116108491A (zh) 基于半监督联邦学习的数据泄露预警方法、装置及系统
CN114090994A (zh) 一种基于区块链的人脸识别认证方法及系统
CN114661934B (zh) 基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法
CN112667888A (zh) 一种基于区块链的大数据处理系统
CN114661974B (zh) 利用自然语言语义分析的政务网站舆情分析与预警的方法
US20020017781A1 (en) Seat belt guide
CN115426189A (zh) 一种基于大数据的信息安全防护方法和系统
CN112491840B (zh) 信息修改方法、装置、计算机设备及存储介质
CN113179249B (zh) 大数据网络中政务数据快速安全挖掘方法
CN113190508B (zh) 一种面向管理的自然语言识别方法
CN113807679A (zh) 一种面向园区执法的管理系统
CN109120648B (zh) 一种实时监控数据防篡改验证系统
CN112508101A (zh) 一种神经网络模型的调整系统、方法及设备
CN110717078A (zh) 美容院店务数据监控方法、装置、设备及介质
CN114640527B (zh) 基于日志审计的不动产登记业务网络安全风险识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant