CN114661934B - 基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法 - Google Patents
基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法 Download PDFInfo
- Publication number
- CN114661934B CN114661934B CN202210276570.8A CN202210276570A CN114661934B CN 114661934 B CN114661934 B CN 114661934B CN 202210276570 A CN202210276570 A CN 202210276570A CN 114661934 B CN114661934 B CN 114661934B
- Authority
- CN
- China
- Prior art keywords
- public opinion
- key
- words
- handheld terminal
- mobile intelligent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000012544 monitoring process Methods 0.000 title claims abstract description 16
- 238000005516 engineering process Methods 0.000 title claims abstract description 14
- 238000007418 data mining Methods 0.000 title claims abstract description 13
- 238000004891 communication Methods 0.000 claims description 30
- 238000000605 extraction Methods 0.000 claims description 12
- 102100029727 Enteropeptidase Human genes 0.000 claims description 9
- 101001012451 Homo sapiens Enteropeptidase Proteins 0.000 claims description 9
- 238000012795 verification Methods 0.000 claims description 3
- 238000000926 separation method Methods 0.000 description 12
- 230000010485 coping Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Library & Information Science (AREA)
- Tourism & Hospitality (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Educational Administration (AREA)
- Probability & Statistics with Applications (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出了一种基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法,包括以下步骤:S1,获取图像文件,根据获取的图像文件提取图像文件中的文字数据;S2,获取舆情警示词数据库,对获取的舆情警示词进行分组,对每组舆情警示词设置一个舆情中心警示词作为标准舆情词,将标准舆情词作为起始节点,设置其它相近舆情词到标准舆情词的距离小于预设距离阈值,将其相近舆情词分为同一组;S3,根据步骤S1中提取的文字数据识别出舆情警示词。本发明能够实现对政府平台上收集的文字信息进行舆情监测。
Description
技术领域
本发明涉及一种政务舆情技术领域,特别是涉及一种基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法。
背景技术
舆情监测是一项交叉了社会科学和数据科学的复杂技术,需要在舆情发生初期对事件有个初步的预判,充分做好应对准备。针对舆情事件的描述,主要来自网络媒体上的新闻文本和类似新浪微博的社交平台,人们通过阅读、转发、评论等,直接告知他人或者从他人那里间接了解到舆情事件的相关信息。
发明内容
本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法。
为了实现本发明的上述目的,本发明提供了一种基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法,包括以下步骤:
S1,获取图像文件,根据获取的图像文件提取图像文件中的文字数据;
S2,获取舆情警示词数据库,对获取的舆情警示词进行分组,对每组舆情警示词设置一个舆情中心警示词作为标准舆情词,将标准舆情词作为起始节点,设置其它相近舆情词到标准舆情词的距离小于预设距离阈值,将其相近舆情词分为同一组;
S3,根据步骤S1中提取的文字数据识别出舆情警示词。
在本发明的一种优选实施方式中,图像文件的格式包括bmp、jpg、png、tif、gif之一或者任意组合。
在本发明的一种优选实施方式中,在步骤S1中根据获取的图像文件提取图像文件中的文字数据的方法包括以下步骤:
S11,令λ=1;
S12,对第λ图像进行操作:
w=N/(P×Q),
其中,Q表示第λ图像的高度;
P表示第λ图像的宽度;
w表示像素目标点的总像素个数与第λ图像的比数;
N表示图像分离阈值H大于或者等于提取第λ图像中的灰度值的个数;
S13,w′=(-N+P×Q)/P×Q,
w′表示像素背景点的总像素个数与第λ图像的比数;
其中,ζ表示目标图像的灰度平均值;
Ai∈A={A1,A2,A3,...,AN,AN+1},
其中,A表示目标图像中的所有像素点的灰度值集;
Ai表示目标图像中的第i个像素点的灰度值;
S14,
其中,ξ表示背景图像的灰度平均值;
Bj∈B={B1,B2,B3,…,BP×Q-N,BP×Q-N+1},
其中,B表示背景图像中的所有像素点的灰度值集;
Bj表示背景图像中的第j个像素点的灰度值;
S15,
其中,表示提取第λ图像的灰度平均值;
S16,
其中,η表示图像方差灰度值;
使用遍历方法让图像方差灰度值最大ηmax时,得到图像分离阈值H;
S17,判定图像分离阈值H与提取第λ图像中的第k个像素点灰度值Iλ,k的关系大小:
若Iλ,k≤H,则令Iλ,k=255;
若Iλ,k>H,则令Iλ,k=0;k=1,2,3,…,P×Q;
S18,提取第λ图像中的目标图像中的文字;
S19,判断λ与间的关系大小:
若 表示图像文件中图像的总张数;则结束;
若则λ=λ+1,返回步骤S12。
在本发明的一种优选实施方式中,在步骤S2中,相近舆情词到标准舆情词的距离的计算方法为:
其中,aij表示相近舆情词在特征点(i,j)处的词性值;
I表示相近舆情词中每行特征点的总个数;
J表示相近舆情词中每列特征点的总个数;
表示相近舆情词的系数;/>
bij表示标准舆情词在特征点(i,j)处的词性值;
I′表示标准舆情词中每行特征点的总个数;
J′表示标准舆情词中每列特征点的总个数;
φ表示标准舆情词的系数;φ∈(0,1)。
在本发明的一种优选实施方式中,还包括步骤S4,通过移动智能手持终端登录查看识别出的舆情警示词。
本发明还公开了一种基于数据挖掘分析技术多维度监控政务新媒体舆情预警的系统,包括获取提取模块、分组模块和识别模块;
获取提取模块的数据输出端与分组模块的数据输入端相连,分组模块的数据输出端与识别模块的数据输入端相连;
获取提取模块用于获取图像文件,根据获取的图像文件提取图像文件中的文字数据;
分组模块用于获取舆情警示词数据库,对获取的舆情警示词进行分组,对每组舆情警示词设置一个舆情中心警示词作为标准舆情词,将标准舆情词作为起始节点,设置其它相近舆情词到标准舆情词的距离小于预设距离阈值,将其相近舆情词分为同一组;
识别模块用于根据获取提取模块中提取的文字数据识别出舆情警示词。
在本发明的一种优选实施方式中,图像文件的格式包括bmp、jpg、png、tif、gif之一或者任意组合。
在本发明的一种优选实施方式中,在步骤S1中根据获取的图像文件提取图像文件中的文字数据的方法包括以下步骤:
S11,令λ=1;
S12,对第λ图像进行操作:
w=N/(P×Q),
其中,Q表示第λ图像的高度;
P表示第λ图像的宽度;
w表示像素目标点的总像素个数与第λ图像的比数;
N表示图像分离阈值H大于或者等于提取第λ图像中的灰度值的个数;
S13,w′=(-N+P×Q)/P×Q,
w′表示像素背景点的总像素个数与第λ图像的比数;
其中,ζ表示目标图像的灰度平均值;
Ai∈A={A1,A2,A3,…,AN,AN+1},
其中,A表示目标图像中的所有像素点的灰度值集;
Ai表示目标图像中的第i个像素点的灰度值;
S14,
其中,ξ表示背景图像的灰度平均值;
Bj∈B={B1,B2,B3,…,BP×Q-N,BP×Q-N+1},
其中,B表示背景图像中的所有像素点的灰度值集;
Bj表示背景图像中的第j个像素点的灰度值;
S15,
其中,表示提取第λ图像的灰度平均值;
S16,
其中,η表示图像方差灰度值;
使用遍历方法让图像方差灰度值最大ηmax时,得到图像分离阈值H;
S17,判定图像分离阈值H与提取第λ图像中的第k个像素点灰度值Iλ,k的关系大小:
若Iλ,k≤H,则令Iλ,k=255;
若Iλ,k>H,则令Iλ,k=0;k=1,2,3,…,P×Q;
S18,提取第λ图像中的目标图像中的文字;
S19,判断λ与间的关系大小:
若 表示图像文件中图像的总张数;则结束;
若则λ=λ+1,返回步骤S12。
在本发明的一种优选实施方式中,在步骤S2中,相近舆情词到标准舆情词的距离的计算方法为:
其中,aij表示相近舆情词在特征点(i,j)处的词性值;
I表示相近舆情词中每行特征点的总个数;
J表示相近舆情词中每列特征点的总个数;
表示相近舆情词的系数;/>
bij表示标准舆情词在特征点(i,j)处的词性值;
I′表示标准舆情词中每行特征点的总个数;
J′表示标准舆情词中每列特征点的总个数;
φ表示标准舆情词的系数;φ∈(0,1)。
在本发明的一种优选实施方式中,还包括登录查看模块,登录查看模块用于通过移动智能手持终端登录查看识别出的舆情警示词。
综上所述,由于采用了上述技术方案,本发明能够实现对政府平台上收集的文字信息进行舆情监测。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明流程示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
本发明提供了一种基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法,如图1所示,包括以下步骤:
S1,获取图像文件,根据获取的图像文件提取图像文件中的文字数据;
S2,获取舆情警示词数据库,对获取的舆情警示词进行分组,对每组舆情警示词设置一个舆情中心警示词作为标准舆情词,将标准舆情词作为起始节点,设置其它相近舆情词到标准舆情词的距离小于预设距离阈值,将其相近舆情词分为同一组;
S3,根据步骤S1中提取的文字数据识别出舆情警示词。
在本发明的一种优选实施方式中,图像文件的格式包括bmp、jpg、png、tif、gif之一或者任意组合。
在本发明的一种优选实施方式中,在步骤S1中根据获取的图像文件提取图像文件中的文字数据的方法包括以下步骤:
S11,令λ=1;
S12,对第λ图像进行操作:
w=N/(P×Q),
其中,Q表示第λ图像的高度;
P表示第λ图像的宽度;
w表示像素目标点的总像素个数与第λ图像的比数;
N表示图像分离阈值H大于或者等于提取第λ图像中的灰度值的个数;
S13,w′=(-N+P×Q)/P×Q,
w′表示像素背景点的总像素个数与第λ图像的比数;
其中,ζ表示目标图像的灰度平均值;
Ai∈A={A1,A2,A3,...,AN,AN+1},
其中,A表示目标图像中的所有像素点的灰度值集;
Ai表示目标图像中的第i个像素点的灰度值;
S14,
其中,ξ表示背景图像的灰度平均值;
Bj∈B={B1,B2,B3,...,BP×Q-N,BP×Q-N+1},
其中,B表示背景图像中的所有像素点的灰度值集;
Bj表示背景图像中的第j个像素点的灰度值;
S15,
其中,表示提取第λ图像的灰度平均值;
S16,
其中,η表示图像方差灰度值;
使用遍历方法让图像方差灰度值最大ηmax时,得到图像分离阈值H;
S17,判定图像分离阈值H与提取第λ图像中的第k个像素点灰度值Iλ,k的关系大小:
若Iλ,k≤H,则令Iλ,k=255;
若Iλ,k>H,则令Iλ,k=0;k=1,2,3,...,P×Q;
S18,提取第λ图像中的目标图像中的文字;
S19,判断λ与间的关系大小:
若 表示图像文件中图像的总张数;则结束;
若则λ=λ+1,返回步骤S12。
在本发明的一种优选实施方式中,在步骤S2中,相近舆情词到标准舆情词的距离的计算方法为:
其中,aij表示相近舆情词在特征点(i,j)处的词性值;
I表示相近舆情词中每行特征点的总个数;
J表示相近舆情词中每列特征点的总个数;
表示相近舆情词的系数;/>
bij表示标准舆情词在特征点(i,j)处的词性值;
I′表示标准舆情词中每行特征点的总个数;
J′表示标准舆情词中每列特征点的总个数;
φ表示标准舆情词的系数;φ∈(0,1)。
在本发明的一种优选实施方式中,还包括步骤S4,通过移动智能手持终端登录查看识别出的舆情警示词。通过移动智能手持终端登录服务器端的方法包括以下步骤:
S41,服务器端获取得到SM4对称秘钥SM4_KEY,移动智能手持终端获取得到通讯标识TK;服务器端获取得到SM4对称秘钥SM4_KEY,移动智能手持终端获取得到通讯标识TK的方法包括以下步骤:
S411,移动智能手持终端向服务器端发送获取SM2公钥请求,在服务器端上存放有SM2公钥SM2_PUBKEY和SM2私钥SM2_PRIKEY对;
S412,服务器端接收到移动智能手持终端发送的SM2公钥请求后,将SM2公钥SM2_PUBKEY以明文形式返回给移动智能手持终端;
S413,移动智能手持终端接收到服务器端发送的SM2公钥SM2_PUBKEY后,生成一个SM4对称秘钥SM4_KEY;
S414,使用SM2公钥SM2_PUBKEY对SM4对称秘钥SM4_KEY做SM2加密得到密文ENSM4K,并发送密文ENSM4K给服务器端;
S415,服务器端接收到移动智能手持终端发送的密文ENSM4K后,用SM2私钥SM2_PRIKEY对接收到的密文ENSM4K进行解密,解密后得到SM4对称秘钥SM4_KEY,同时生成一个通讯标识TK;
S416,将通讯标识TK与SM4对称秘钥SM4_KEY建立关联形成KV键值对存储在缓存服务器端redis中;用SM4对称秘钥SM4_KEY对通讯标识TK进行SM4对称加密,得到加密标识ENTK,返回给移动智能手持终端;
S417,移动智能手持终端用SM4对称秘钥SM4_KEY对接收到的加密标识ENTK进行SM4对称解密得到通讯标识TK。SM4对称秘钥SM4_KEY具有时效性,可以是一小时、一天、一个月等,过期后更新SM4对称秘钥SM4_KEY,为了更加安全,服务器端也可以同时更新SM2公钥SM2_PUBKEY和SM2私钥SM2_PRIKEY对。
S42,移动智能手持终端对获取的用户名和密码分别利用SM4对称秘钥SM4_KEY进行加密,得到其加密用户名和加密密码;移动智能手持终端将其加密用户名和加密密码以及通讯标识TK发送至服务器端;
S43,服务器端接收到移动智能手持终端发送的加密用户名和加密密码以及通讯标识TK后,根据通讯标识TK从缓存服务器端redis中获取通讯标识TK所对应的SM4对称秘钥SM4_KEY;
S44,服务器端利用步骤S43中得到的SM4对称秘钥SM4_KEY对加密用户名和加密密码进行解密,得到其解密用户名和解密密码;验证通过后,移动智能手持终端登录服务器端成功。
本发明还公开了一种基于数据挖掘分析技术多维度监控政务新媒体舆情预警的系统,包括获取提取模块、分组模块和识别模块;
获取提取模块的数据输出端与分组模块的数据输入端相连,分组模块的数据输出端与识别模块的数据输入端相连;
获取提取模块用于获取图像文件,根据获取的图像文件提取图像文件中的文字数据;
分组模块用于获取舆情警示词数据库,对获取的舆情警示词进行分组,对每组舆情警示词设置一个舆情中心警示词作为标准舆情词,将标准舆情词作为起始节点,设置其它相近舆情词到标准舆情词的距离小于预设距离阈值,将其相近舆情词分为同一组;
识别模块用于根据获取提取模块中提取的文字数据识别出舆情警示词。
在本发明的一种优选实施方式中,图像文件的格式包括bmp、jpg、png、tif、gif之一或者任意组合。
在本发明的一种优选实施方式中,在步骤S1中根据获取的图像文件提取图像文件中的文字数据的方法包括以下步骤:
S11,令λ=1;
S12,对第λ图像进行操作:
w=N/(P×Q),
其中,Q表示第λ图像的高度;
P表示第λ图像的宽度;
w表示像素目标点的总像素个数与第λ图像的比数;
N表示图像分离阈值H大于或者等于提取第λ图像中的灰度值的个数;
S13,w′=(-N+P×Q)/P×Q,
w′表示像素背景点的总像素个数与第λ图像的比数;
其中,ζ表示目标图像的灰度平均值;
Ai∈A={A1,A2,A3,...,AN,AN+1},
其中,A表示目标图像中的所有像素点的灰度值集;
Ai表示目标图像中的第i个像素点的灰度值;
S14,
其中,ξ表示背景图像的灰度平均值;
Bj∈B={B1,B2,B3,...,BP×Q-N,BP×Q-N+1},
其中,B表示背景图像中的所有像素点的灰度值集;
Bj表示背景图像中的第j个像素点的灰度值;
S15,
其中,表示提取第λ图像的灰度平均值;
S16,
其中,η表示图像方差灰度值;
使用遍历方法让图像方差灰度值最大ηmax时,得到图像分离阈值H;
S17,判定图像分离阈值H与提取第λ图像中的第k个像素点灰度值Iλ,k的关系大小:
若Iλ,k≤H,则令Iλ,k=255;
若Iλ,k>H,则令Iλ,k=0;k=1,2,3,...,P×Q;
S18,提取第λ图像中的目标图像中的文字;
S19,判断λ与间的关系大小:
若 表示图像文件中图像的总张数;则结束;
若则λ=λ+1,返回步骤S12。
在本发明的一种优选实施方式中,在步骤S2中,相近舆情词到标准舆情词的距离的计算方法为:
其中,aij表示相近舆情词在特征点(i,j)处的词性值;
I表示相近舆情词中每行特征点的总个数;
J表示相近舆情词中每列特征点的总个数;
表示相近舆情词的系数;/>
bij表示标准舆情词在特征点(i,j)处的词性值;
I′表示标准舆情词中每行特征点的总个数;
J′表示标准舆情词中每列特征点的总个数;
φ表示标准舆情词的系数;φ∈(0,1)。
在本发明的一种优选实施方式中,还包括登录查看模块,登录查看模块用于通过移动智能手持终端登录查看识别出的舆情警示词。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
Claims (4)
1.一种基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法,其特征在于,包括以下步骤:
S1,获取图像文件,根据获取的图像文件提取图像文件中的文字数据;
S2,获取舆情警示词数据库,对获取的舆情警示词进行分组,对每组舆情警示词设置一个舆情中心警示词作为标准舆情词,将标准舆情词作为起始节点,设置其它相近舆情词到标准舆情词的距离小于预设距离阈值,将其相近舆情词分为同一组;
其中,相近舆情词到标准舆情词的距离的计算方法为:
其中,aij表示相近舆情词在特征点(i,j)处的词性值;
I表示相近舆情词中每行特征点的总个数;
J表示相近舆情词中每列特征点的总个数;
表示相近舆情词的系数;/>
bij表示标准舆情词在特征点(i,j)处的词性值;
I′表示标准舆情词中每行特征点的总个数;
J′表示标准舆情词中每列特征点的总个数;
φ表示标准舆情词的系数;φ∈(0,1);
S3,根据步骤S1中提取的文字数据通过步骤S2中的舆情警示词数据库识别出舆情警示词;
S4,通过移动智能手持终端登录查看识别出的舆情警示词,通过移动智能手持终端登录服务器端的方法包括以下步骤:
S41,服务器端获取得到SM4对称秘钥SM4_KEY,移动智能手持终端获取得到通讯标识TK;服务器端获取得到SM4对称秘钥SM4_KEY,移动智能手持终端获取得到通讯标识TK的方法包括以下步骤:
S411,移动智能手持终端向服务器端发送获取SM2公钥请求,在服务器端上存放有SM2公钥SM2_PUBKEY和SM2私钥SM2_PRIKEY对;
S412,服务器端接收到移动智能手持终端发送的SM2公钥请求后,将SM2公钥SM2_PUBKEY以明文形式返回给移动智能手持终端;
S413,移动智能手持终端接收到服务器端发送的SM2公钥SM2_PUBKEY后,生成一个SM4对称秘钥SM4_KEY;
S414,使用SM2公钥SM2_PUBKEY对SM4对称秘钥SM4_KEY做SM2加密得到密文ENSM4K,并发送密文ENSM4K给服务器端;
S415,服务器端接收到移动智能手持终端发送的密文ENSM4K后,用SM2私钥SM2_PRIKEY对接收到的密文ENSM4K进行解密,解密后得到SM4对称秘钥SM4_KEY,同时生成一个通讯标识TK;
S416,将通讯标识TK与SM4对称秘钥SM4_KEY建立关联形成KV键值对存储在缓存服务器端redis中;用SM4对称秘钥SM4_KEY对通讯标识TK进行SM4对称加密,得到加密标识ENTK,返回给移动智能手持终端;
S417,移动智能手持终端用SM4对称秘钥SM4_KEY对接收到的加密标识ENTK进行SM4对称解密得到通讯标识TK;
S42,移动智能手持终端对获取的用户名和密码分别利用SM4对称秘钥SM4_KEY进行加密,得到其加密用户名和加密密码;移动智能手持终端将其加密用户名和加密密码以及通讯标识TK发送至服务器端;
S43,服务器端接收到移动智能手持终端发送的加密用户名和加密密码以及通讯标识TK后,根据通讯标识TK从缓存服务器端redis中获取通讯标识TK所对应的SM4对称秘钥SM4_KEY;
S44,服务器端利用步骤S43中得到的SM4对称秘钥SM4_KEY对加密用户名和加密密码进行解密,得到其解密用户名和解密密码;验证通过后,移动智能手持终端登录服务器端成功。
2.根据权利要求1所述的基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法,其特征在于,图像文件的格式包括bmp、jpg、png、tif、gif之一或者任意组合。
3.一种基于数据挖掘分析技术多维度监控政务新媒体舆情预警的系统,其特征在于,包括获取提取模块、分组模块和识别模块;
获取提取模块的数据输出端与分组模块的数据输入端相连,分组模块的数据输出端与识别模块的数据输入端相连;
获取提取模块用于获取图像文件,根据获取的图像文件提取图像文件中的文字数据;
分组模块用于获取舆情警示词数据库,对获取的舆情警示词进行分组,对每组舆情警示词设置一个舆情中心警示词作为标准舆情词,将标准舆情词作为起始节点,设置其它相近舆情词到标准舆情词的距离小于预设距离阈值,将其相近舆情词分为同一组;
其中,相近舆情词到标准舆情词的距离的计算方法为:
其中,aij表示相近舆情词在特征点(i,j)处的词性值;
I表示相近舆情词中每行特征点的总个数;
J表示相近舆情词中每列特征点的总个数;
表示相近舆情词的系数;/>
bij表示标准舆情词在特征点(i,j)处的词性值;
I′表示标准舆情词中每行特征点的总个数;
J′表示标准舆情词中每列特征点的总个数;
φ表示标准舆情词的系数;φ∈(0,1);
识别模块用于根据获取提取模块中提取的文字数据通过分组模块中的舆情警示词数据库识别出舆情警示词;
还包括登录查看模块,登录查看模块用于通过移动智能手持终端登录查看识别出的舆情警示词,通过移动智能手持终端登录服务器端的方法包括以下步骤:
S41,服务器端获取得到SM4对称秘钥SM4_KEY,移动智能手持终端获取得到通讯标识TK;服务器端获取得到SM4对称秘钥SM4_KEY,移动智能手持终端获取得到通讯标识TK的方法包括以下步骤:
S411,移动智能手持终端向服务器端发送获取SM2公钥请求,在服务器端上存放有SM2公钥SM2_PUBKEY和SM2私钥SM2_PRIKEY对;
S412,服务器端接收到移动智能手持终端发送的SM2公钥请求后,将SM2公钥SM2_PUBKEY以明文形式返回给移动智能手持终端;
S413,移动智能手持终端接收到服务器端发送的SM2公钥SM2_PUBKEY后,生成一个SM4对称秘钥SM4_KEY;
S414,使用SM2公钥SM2_PUBKEY对SM4对称秘钥SM4_KEY做SM2加密得到密文ENSM4K,并发送密文ENSM4K给服务器端;
S415,服务器端接收到移动智能手持终端发送的密文ENSM4K后,用SM2私钥SM2_PRIKEY对接收到的密文ENSM4K进行解密,解密后得到SM4对称秘钥SM4_KEY,同时生成一个通讯标识TK;
S416,将通讯标识TK与SM4对称秘钥SM4_KEY建立关联形成KV键值对存储在缓存服务器端redis中;用SM4对称秘钥SM4_KEY对通讯标识TK进行SM4对称加密,得到加密标识ENTK,返回给移动智能手持终端;
S417,移动智能手持终端用SM4对称秘钥SM4_KEY对接收到的加密标识ENTK进行SM4对称解密得到通讯标识TK;
S42,移动智能手持终端对获取的用户名和密码分别利用SM4对称秘钥SM4_KEY进行加密,得到其加密用户名和加密密码;移动智能手持终端将其加密用户名和加密密码以及通讯标识TK发送至服务器端;
S43,服务器端接收到移动智能手持终端发送的加密用户名和加密密码以及通讯标识TK后,根据通讯标识TK从缓存服务器端redis中获取通讯标识TK所对应的SM4对称秘钥SM4_KEY;
S44,服务器端利用步骤S43中得到的SM4对称秘钥SM4_KEY对加密用户名和加密密码进行解密,得到其解密用户名和解密密码;验证通过后,移动智能手持终端登录服务器端成功。
4.根据权利要求3所述的基于数据挖掘分析技术多维度监控政务新媒体舆情预警的系统,其特征在于,图像文件的格式包括bmp、jpg、png、tif、gif之一或者任意组合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210276570.8A CN114661934B (zh) | 2022-03-21 | 2022-03-21 | 基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210276570.8A CN114661934B (zh) | 2022-03-21 | 2022-03-21 | 基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114661934A CN114661934A (zh) | 2022-06-24 |
CN114661934B true CN114661934B (zh) | 2024-03-01 |
Family
ID=82032304
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210276570.8A Active CN114661934B (zh) | 2022-03-21 | 2022-03-21 | 基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114661934B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109600233A (zh) * | 2019-01-15 | 2019-04-09 | 西安电子科技大学 | 基于sm2数字签名算法的群签名标识签发方法 |
KR20190046104A (ko) * | 2017-10-25 | 2019-05-07 | (주)다래전략사업화센터 | 특허 빅데이터 분석 방법론을 활용한 기술 융합형 디자인 솔루션 비즈니스 모델 |
CN110163013A (zh) * | 2019-05-22 | 2019-08-23 | 上海上湖信息技术有限公司 | 一种检测敏感信息的方法和设备 |
CN110929683A (zh) * | 2019-12-09 | 2020-03-27 | 北京赋乐科技有限公司 | 一种基于人工智能的视频舆情监测方法及系统 |
CN111191695A (zh) * | 2019-12-19 | 2020-05-22 | 杭州安恒信息技术股份有限公司 | 一种基于深度学习的网站图片篡改检测方法 |
CN112887080A (zh) * | 2020-09-04 | 2021-06-01 | 深圳奥联信息安全技术有限公司 | 基于sm2的密钥生成方法及系统 |
CN113128209A (zh) * | 2021-04-22 | 2021-07-16 | 百度在线网络技术(北京)有限公司 | 用于生成词库的方法及装置 |
CN113220533A (zh) * | 2021-05-21 | 2021-08-06 | 南京诺迈特网络科技有限公司 | 一种网络舆情监控方法及系统 |
CN113505387A (zh) * | 2021-08-02 | 2021-10-15 | 合肥金瀚科技有限公司 | 一种量子秘钥生成终端系统 |
CN113918979A (zh) * | 2021-10-29 | 2022-01-11 | 西安邮电大学 | 基于移动key密钥保护技术的sm2签名方法 |
-
2022
- 2022-03-21 CN CN202210276570.8A patent/CN114661934B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190046104A (ko) * | 2017-10-25 | 2019-05-07 | (주)다래전략사업화센터 | 특허 빅데이터 분석 방법론을 활용한 기술 융합형 디자인 솔루션 비즈니스 모델 |
CN109600233A (zh) * | 2019-01-15 | 2019-04-09 | 西安电子科技大学 | 基于sm2数字签名算法的群签名标识签发方法 |
CN110163013A (zh) * | 2019-05-22 | 2019-08-23 | 上海上湖信息技术有限公司 | 一种检测敏感信息的方法和设备 |
CN110929683A (zh) * | 2019-12-09 | 2020-03-27 | 北京赋乐科技有限公司 | 一种基于人工智能的视频舆情监测方法及系统 |
CN111191695A (zh) * | 2019-12-19 | 2020-05-22 | 杭州安恒信息技术股份有限公司 | 一种基于深度学习的网站图片篡改检测方法 |
CN112887080A (zh) * | 2020-09-04 | 2021-06-01 | 深圳奥联信息安全技术有限公司 | 基于sm2的密钥生成方法及系统 |
CN113128209A (zh) * | 2021-04-22 | 2021-07-16 | 百度在线网络技术(北京)有限公司 | 用于生成词库的方法及装置 |
CN113220533A (zh) * | 2021-05-21 | 2021-08-06 | 南京诺迈特网络科技有限公司 | 一种网络舆情监控方法及系统 |
CN113505387A (zh) * | 2021-08-02 | 2021-10-15 | 合肥金瀚科技有限公司 | 一种量子秘钥生成终端系统 |
CN113918979A (zh) * | 2021-10-29 | 2022-01-11 | 西安邮电大学 | 基于移动key密钥保护技术的sm2签名方法 |
Non-Patent Citations (3)
Title |
---|
刘树春等.基于深度学习的文字识别.《深度实践OCR基于深度学习的文字识别》.2020, * |
吴良斌.SAR图像处理与目标识别.《SAR图像处理与目标识别》.2013, * |
张明书等.《基于安卓系统的隐私保护技术》.西安电子科技大学出版社,2021,66-68. * |
Also Published As
Publication number | Publication date |
---|---|
CN114661934A (zh) | 2022-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10181168B2 (en) | Personal safety verification system and similarity search method for data encrypted for confidentiality | |
CN1860724B (zh) | 用于标识的方法 | |
US10621440B2 (en) | Network switching appliance, process and system for performing visual analytics for a streaming video | |
US7017182B2 (en) | Method of securely transmitting information | |
US8700912B2 (en) | Identification based on encrypted biometric data | |
CN103514286A (zh) | 好友推荐系统及方法 | |
CN113656661B (zh) | 基于自然语言识别的移动政务系统 | |
CN111062043B (zh) | 基于边缘计算的医疗影像识别方法及系统 | |
CN113870999B (zh) | 基于算法、医学影像和区块链的远程疾病智能诊断系统和辅助诊断方法 | |
CN115761840A (zh) | 基于大数据平台下的人脸识别保护系统 | |
CN116108491A (zh) | 基于半监督联邦学习的数据泄露预警方法、装置及系统 | |
CN114090994A (zh) | 一种基于区块链的人脸识别认证方法及系统 | |
CN114661934B (zh) | 基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法 | |
CN112667888A (zh) | 一种基于区块链的大数据处理系统 | |
CN114661974B (zh) | 利用自然语言语义分析的政务网站舆情分析与预警的方法 | |
US20020017781A1 (en) | Seat belt guide | |
CN115426189A (zh) | 一种基于大数据的信息安全防护方法和系统 | |
CN112491840B (zh) | 信息修改方法、装置、计算机设备及存储介质 | |
CN113179249B (zh) | 大数据网络中政务数据快速安全挖掘方法 | |
CN113190508B (zh) | 一种面向管理的自然语言识别方法 | |
CN113807679A (zh) | 一种面向园区执法的管理系统 | |
CN109120648B (zh) | 一种实时监控数据防篡改验证系统 | |
CN112508101A (zh) | 一种神经网络模型的调整系统、方法及设备 | |
CN110717078A (zh) | 美容院店务数据监控方法、装置、设备及介质 | |
CN114640527B (zh) | 基于日志审计的不动产登记业务网络安全风险识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |