CN117611300A - 一种评标违规行为检测方法及系统 - Google Patents
一种评标违规行为检测方法及系统 Download PDFInfo
- Publication number
- CN117611300A CN117611300A CN202311623974.0A CN202311623974A CN117611300A CN 117611300 A CN117611300 A CN 117611300A CN 202311623974 A CN202311623974 A CN 202311623974A CN 117611300 A CN117611300 A CN 117611300A
- Authority
- CN
- China
- Prior art keywords
- information
- preset
- keywords
- alarm
- violation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000004590 computer program Methods 0.000 claims abstract description 25
- 238000013528 artificial neural network Methods 0.000 claims abstract description 11
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 9
- 206010000117 Abnormal behaviour Diseases 0.000 claims description 21
- 238000012937 correction Methods 0.000 claims description 21
- 238000001228 spectrum Methods 0.000 claims description 18
- 230000002159 abnormal effect Effects 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 12
- 230000003287 optical effect Effects 0.000 claims description 11
- 238000012549 training Methods 0.000 claims description 11
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 5
- 230000005856 abnormality Effects 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 abstract description 31
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000012544 monitoring process Methods 0.000 abstract description 2
- 238000003058 natural language processing Methods 0.000 abstract description 2
- 230000000007 visual effect Effects 0.000 abstract description 2
- 230000006399 behavior Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 6
- 238000013500 data storage Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000005286 illumination Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000012854 evaluation process Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000004146 energy storage Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/08—Auctions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- Marketing (AREA)
- Software Systems (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Tourism & Hospitality (AREA)
- Molecular Biology (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- Mathematical Physics (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Development Economics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Entrepreneurship & Innovation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
Abstract
本申请涉及一种评标违规行为检测方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取音频信息并将所述音频信息转换为频域特征信息;通过循环神经网络建立声学模型将频域特征信息映射到文本序列;基于所述声学模型和预设的语言模型计算文本序列的最佳排列;若最佳排列的文本序列与预设的违规关键词相匹配,则在预设的告警库中发送与违规关键词对应的警报信息,所述告警库中储存有不同的违规关键词以及与违规关键词相对应警报信息。采用本方法通过结合自然语言处理和视觉识别技术,实现了对评标专家在封闭评标场所内违规行为的监测和判断,提高了评标的公正性和公平性。
Description
技术领域
本申请涉及评标违规行为的技术领域,特别是涉及一种评标违规行为检测方法、装置、设备及存储介质。
背景技术
评标是指评标委员会和招标人依据招标文件规定的评标标准和方法对投标文件进行审查、评审和比较的行为;评标是招标投标活动中十分重要的阶段,评标是否真正做到公开、公平、公正,决定着整个招标投标活动是否公平和公正;评标的质量决定着能否从众多投标竞争者中选出最能满足招标项目各项要求的中标者。
在评标过程中,通常会邀请评标专家对投标文件进行专业的审查、评审和比较,评标专家是指在招标投标和政府采购活动中依法对投标人提交的资格预审申请文件和投标文件进行审查或评审的具有一定水平的专业人员。
传统专家评标的过程中,评标专家可能会通过交头接耳、聚集讨论等方式进行违规行为,这些行为难以通过传统方式进行监测和判断,导致评标结果并不公正。
发明内容
基于此,有必要针对上述技术问题,提供一种能够考虑输电网和储能系统的扩展规划方式长期和短期的不确定性的评标违规行为检测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种评标违规行为检测方法。方法包括:
获取音频信息并将所述音频信息转换为频域特征信息;
通过循环神经网络建立声学模型将频域特征信息映射到文本序列;
基于所述声学模型和预设的语言模型计算文本序列的最佳排列;
若最佳排列的文本序列与预设的违规关键词相匹配,则在预设的告警库中发送与违规关键词对应的警报信息,所述告警库中储存有不同的违规关键词以及与违规关键词相对应警报信息。
在其中一个实施例中,所述获取音频信息并将所述音频信息转换为频域特征信息包括:
获取音频信息并将音频信息中的杂音进行预处理;
将预处理后的音频信息切分成预设时间长度的短帧音频;
使用预设的窗函数对短帧音频进行优化操作;
将经过窗函数优化后的短帧音频进行离散傅里叶变换并获取每帧对应的频谱信息;
将所述频谱信息进行过滤和对数压缩并获取优化频谱;
基于优化频谱进行离散余弦变换并获取频域特征信息。
在其中一个实施例中,所述基于所述声学模型和预设的语言模型计算文本序列的最佳排列包括:
收集弱监督数据;
针对所述弱监督数据进行清洗和降噪的预处理;
将预处理后的弱监督数据输入到所述声学模型和预设的语言模型中并输出对应的文本序列;
通过弱监督数据对所述声学模型和预设的语言模型进行训练直至弱监督数据与生成的文本序列的匹配度达到预设的匹配范围内;
基于所述声学模型和预设的语言模型计算文本序列的最佳排列。
在其中一个实施例中,所述方法还包括:
获取摄像图片信息;
若所述摄像图片信息为人脸信息,则获取人脸关键点;
基于人脸关键点对摄像图片信息进行几何校正和光学矫正;
获取几何校正和光学校正后的摄像图片信息并提取校正人脸关键点;
将所述校正人脸关键点与预设的人脸关键点进行比对;
若校正人脸关键点与预设的人脸关键点不同,则发送与人员异常的报警信息。
在其中一个实施例中,在所述获取摄像图片信息之后,还包括:
若所述摄像图片为人体信息,则获取人体关键点;
判断人体关键点之间是否相互接触;
若人体关键点之间相互接触,则在预设的异常行为库中查询对应的异常关键点,所述异常行为库中储存有不同的异常行为以及与异常行为相对应的异常关键点;
若相互接触的人体关键点与异常关键点相匹配,则发送与异常行为相关的警报信息。
在其中一个实施例中,所述在预设的告警库中发送与违规关键词对应的警报信息包括:
根据最佳排列的文本序列筛选出场景关键词;
将所述场景关键词与预设的场景库中的标准关键词进行比对,所述场景库中储存有不同的标准关键词以及与标准关键词相对应的场景信息
若场景关键词与标准关键词相匹配,则获取对应的场景信息,所述场景信息中包含有对应的报警阈值;
若所述若最佳排列的文本序列与预设的违规关键词的匹配程度位于报警阈值内,则在预设的告警库中不发送与违规关键词对应的警报信息;
否则,在预设的告警库中发送与违规关键词对应的警报信息。
第二方面,本申请还提供了一种评标违规行为检测装置。装置包括:音频信息转换模块,用于获取音频信息并将所述音频信息转换为频域特征信息;
文本序列映射模块,用于通过循环神经网络建立声学模型将频域特征信息映射到文本序列;
文本序列排列模块,用于基于所述声学模型和预设的语言模型计算文本序列的最佳排列;
报警信息发送模块,用于若最佳排列的文本序列与预设的违规关键词相匹配,则在预设的告警库中发送与违规关键词对应的警报信息,所述告警库中储存有不同的违规关键词以及与违规关键词相对应警报信息。
第三方面,本申请还提供了一种计算机设备。计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:
获取音频信息并将所述音频信息转换为频域特征信息;
通过循环神经网络建立声学模型将频域特征信息映射到文本序列;
基于所述声学模型和预设的语言模型计算文本序列的最佳排列;
若最佳排列的文本序列与预设的违规关键词相匹配,则在预设的告警库中发送与违规关键词对应的警报信息,所述告警库中储存有不同的违规关键词以及与违规关键词相对应警报信息。
第四方面,本申请还提供了一种计算机可读存储介质。计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取音频信息并将所述音频信息转换为频域特征信息;
通过循环神经网络建立声学模型将频域特征信息映射到文本序列;
基于所述声学模型和预设的语言模型计算文本序列的最佳排列;
若最佳排列的文本序列与预设的违规关键词相匹配,则在预设的告警库中发送与违规关键词对应的警报信息,所述告警库中储存有不同的违规关键词以及与违规关键词相对应警报信息。
第五方面,本申请还提供了一种计算机程序产品。计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取音频信息并将所述音频信息转换为频域特征信息;
通过循环神经网络建立声学模型将频域特征信息映射到文本序列;
基于所述声学模型和预设的语言模型计算文本序列的最佳排列;
若最佳排列的文本序列与预设的违规关键词相匹配,则在预设的告警库中发送与违规关键词对应的警报信息,所述告警库中储存有不同的违规关键词以及与违规关键词相对应警报信息。
上述评标违规行为检测方法、装置、计算机设备、存储介质和计算机程序产品,获取音频信息并将所述音频信息转换为频域特征信息;通过循环神经网络建立声学模型将频域特征信息映射到文本序列;基于所述声学模型和预设的语言模型计算文本序列的最佳排列;若最佳排列的文本序列与预设的违规关键词相匹配,则在预设的告警库中发送与违规关键词对应的警报信息,所述告警库中储存有不同的违规关键词以及与违规关键词相对应警报信息。本申请采用上述方法,通过结合自然语言处理和视觉识别技术,实现了对评标专家在封闭评标场所内违规行为的监测和判断,提高了评标的公正性和公平性。
附图说明
图1为一个实施例中评标违规行为检测方法的应用环境图;
图2为一个实施例中评标违规行为检测方法的流程图;
图3为一个实施例中将音频信息转换成频域特征信息的示意图;
图4为一个实施例中训练声学模型和语言模型的示意图;
图5为一个实施例中人脸识别的示意图;
图6为一个实施例中人体识别的示意图;
图7为一个实施例中警报信息动态阈值设置的示意图;
图8为一个实施例中评标违规行为检测装置的结构框图;
图9为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的评标违规行为检测方法,本申请实施例提供的评标违规行为检测方法,可以应用于如图1所示的应用环境中。其中,终端通过网络与服务器进行通信。数据存储系统可以存储服务器需要处理的数据。数据存储系统可以集成在服务器上,也可以放在云上或其他网络服务器上。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,本实施例中,该方法包括以下步骤:
步骤202,获取音频信息并将音频信息转换为频域特征信息。
其中,通过评标房间预先布置的语音传感器等收音终端对评标过程中的音频信息进行捕捉,收音终端在捕捉音频信息的过程中同步将音频信息发送至服务器并储存在预设的数据储存系统中,服务器调用数据储存系统中的音频信息并将音频信息转换为MFCC(MelFrequency Cepstral Coefficients)特征。MFCC是一种常用的语音特征,它是一种频域特征,表示语音信号在经过人耳模型的处理后所得到的特征。
步骤204,通过循环神经网络建立声学模型将频域特征信息映射到文本序列。
其中,服务器调用LSTM或GRU等循环神经网络建立声学模型。声学模型将输入的频域特征信息映射到输出的文本序列。
步骤206,基于所述声学模型和预设的语言模型计算文本序列的最佳排列。
其中,语言模型的建立可以通过服务器调用n-gram或统计语言模型等方法建立语言模型,语言模型能够提高识别准确率,根据语料库中单词的先后顺序,来计算一个句子出现的概率;服务器将声学模型和语言模型联合起来,计算给定音频信号序列的最佳文本序列,通过使用集束搜索算法来实现,集束搜索算法能够在不同的候选文本序列中进行搜索,找到最有可能的输出序列。
步骤208,判断最佳排列的文本序列与预设的违规关键词是否匹配。
其中,若最佳排列的文本序列与预设的违规关键词相匹配,则在预设的告警库中发送与违规关键词对应的警报信息;若最佳排列的文本序列与预设的违规关键词不匹配,则不发送与违规关键词对应的警报信息,告警库中储存有不同的违规关键词以及与违规关键词相对应警报信息。
上述评标违规行为检测方法中,实现了对评标专家在封闭评标场所内违规行为的监测和判断,提高了评标的公正性和公平性。
在一个实施例中,如图3所示,考虑到将将音频信息转换为频域特征信息的方法包括多种,本方案可以通过如下步骤实现:
步骤302,获取音频信息并将音频信息中的杂音进行预处理。
其中,服务器将原始音频信号进行预处理步骤,如去除静音段和背景噪音等操作。
步骤304,将预处理后的音频信息切分成预设时间长度的短帧音频。
其中,将预处理后的音频信号分成短时帧,通常每帧长度为20-40毫秒;可以通过使用一个固定长度的时间窗口,例如25毫秒,并使用重叠的方式来实现。
步骤306,使用预设的窗函数对短帧音频进行优化操作。
其中,在语音信号处理中,应用窗函数是为了减少频谱泄漏(spectral leakage)的影响,频谱泄漏是由于在信号分析中使用矩形窗口引起的;窗函数是一个在给定时间窗口内具有不同幅度的权重系数的函数;应用窗函数后,信号在窗口内逐渐减小,并在窗口边缘上逐渐趋于零;可以有效减少信号在频域中的泄漏效应,得到更准确的频谱估计。
步骤308,将经过窗函数优化后的短帧音频进行离散傅里叶变换并获取每帧对应的频谱信息。
步骤310,将所述频谱信息进行过滤和对数压缩并获取优化频谱。
其中,将频谱信号通过一组梅尔滤波器进行滤波,尔滤波器组是一组三角形滤波器,每个滤波器覆盖一定的频率范围,相邻滤波器之间有重叠区域;对滤波器输出进行对数压缩,以使得频谱幅度更接近人耳的感知。
步骤312,基于优化频谱进行离散余弦变换并获取频域特征信息。
其中,只保留前几个主要的频域特征信息,将不重要的频域特征信息舍弃;对频域特征信息进行归一化处理,使得每个系数在更小的取值范围内波动,以减少不同音频之间的幅度差异。
在一个实施例中,如图4所述,针对声学模型和语言模型的训练过程中,可以通过弱监督数据进行训练操作,具体的训练过程可以被执行为:
步骤402,收集弱监督数据并进行预处理操作。
其中,弱监督数据是指标注信息有限或不完全的数据,服务器过多种方式收集弱监督数据,如从互联网上获取数据、利用自动化方法生成数据等;对收集到的弱监督数据进行预处理和清洗,包括去除噪音、处理缺失值、进行分词、去除停用词等,以确保数据的质量。
步骤404,将预处理后的弱监督数据输入到所述声学模型和预设的语言模型中并输出对应的文本序列。
其中,使用弱监督数据对选定的模型进行训练,在调整模型的超参数、使用交叉验证进行模型选择等步骤,以提高模型的性能和泛化能力。
步骤406,通过弱监督数据对所述声学模型和预设的语言模型进行训练直至弱监督数据与生成的文本序列的匹配度达到预设的匹配范围内。
其中,使用验证集或测试集对训练后的模型进行评估,并根据评估结果对模型进行调优;通过调整模型参数、改变模型结构、增加训练数据等方法,以提高模型的性能。
步骤408,基于所述声学模型和预设的语言模型计算文本序列的最佳排列。
在一个实施例中,考虑到需要在评标过程中监管评标人员的违规行为,需要对预设的摄像头拍摄的摄像图片信息进行识别,具体的识别过程可以被执行为:
步骤502,获取摄像图片信息。
其中,通过预设在评标现场的摄像终端对评标现场进行拍摄操作,摄像终端包括并不限于角度固定的摄像终端、360°摄像终端等,通过摄像终端对评标现场进行纪录操作,同时服务器实时获取摄像终端拍摄的画面并储存在预设的数据存储系统中。
步骤504,判断摄像图片是否为人脸信息。
其中,若摄像图片为人脸信息,则获取人脸关键点;若摄像图片中包含有人脸信息且不止有人脸信息,则优先获取人脸关键点。
步骤506,基于人脸关键点对摄像图片信息进行几何校正和光学矫正。
其中,人脸几何校正技术主要用于校正人脸图像中的姿态和角度,为了使人脸图像具有标准化的位置、姿态和大小;在人脸几何校正中,通常会使用关键点检测算法来识别人脸图像中的重要面部特征点,例如眼睛、鼻子和嘴巴等,通过应用旋转、缩放和平移等操作,将检测到的重要特征点对齐到一个标准位置,从而达到校正人脸姿态的效果。
人脸光学矫正技术主要用于校正人脸图像中的光照条件,在实际图像中,由于光源的不同、阴影的存在等原因,人脸图像可能存在明暗不均和光照变化等问题;人脸光学矫正使用各种图像处理方法,例如直方图均衡化、光照校正和阴影去除等,来增强人脸图像的可见性和对比度;通过调整图像的亮度、对比度和色彩平衡等参数,使得人脸图像在不同光照条件下更加一致和清晰。
步骤508,获取几何校正和光学校正后的摄像图片信息并提取校正人脸关键点。
步骤510,将所述校正人脸关键点与预设的人脸关键点进行比对。
其中,若校正人脸关键点与预设的人脸关键点相同,则将预设的人脸关键点的信息标注在图像上;若校正人脸关键点与预设的人脸关键点不同,则发送与人员异常的报警信息。
在一个实施例中,如图6所示,考虑到摄像终端可能存在拍摄过程中没有人脸只有人体的情况,要求摄像终端在人体发出违规操作时,也可以及时发送报警信息,具体的识别过程可以被执行为:
步骤602,判断摄像图片是否为人体信息。
其中,若拍摄图片为人体信息,则获取人体关键点,若拍摄土图像为包括人脸信息和人体信息,则优先识别人脸信息。
步骤604,判断人体关键点之间是否相互接触。
其中,若人体关键点之间相互接触,则在预设的异常行为库中查询对应的异常关键点,异常行为库中储存有不同的异常行为以及与异常行为相对应的异常关键点;若人体关键点之间没有接触,则不发送警报信息。
步骤606,判断人体关键点与异常关键点是否匹配。
其中,若相互接触的人体关键点与异常关键点相匹配,则发送与异常行为相关的警报信息;若相互接触的人体关键点与异常关键点不匹配,则不发送与异常行为相关的警报信息。
在一个实施例中,如图7所示,考虑到不同场景下需要不同的报警灵敏度,需要针对场景对报警信息做出调整,具体的调整操作可以被执行为:
步骤702,根据最佳排列的文本序列筛选出场景关键词。
步骤704,将场景关键词与预设的场景库中的标准关键词进行比对。
其中,场景库中储存有不同的标准关键词以及与标准关键词相对应的场景信息;若场景关键词与标准关键词相匹配,则获取对应的场景信息,场景信息中包含有对应的报警阈值;若场景关键词与标准关键词不匹配,则发送与场景信息异常的报警信息。
步骤706,判断最佳排列的文本序列与违规关键词的匹配程度是否位于报警阈值内。
其中,若所述若最佳排列的文本序列与预设的违规关键词的匹配程度位于报警阈值内,则在预设的告警库中不发送与违规关键词对应的警报信息;否则,在预设的告警库中发送与违规关键词对应的警报信息。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的评标违规行为检测方法的评标违规行为检测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个评标违规行为检测装置实施例中的具体限定可以参见上文中对于评标违规行为检测方法的限定,在此不再赘述。
在一个实施例中,如图8所示,提供了一种评标违规行为检测装置,包括:音频信息转换模块、文本序列映射模块、文本序列排列模块、报警信息发送模块和摄像信息判定模块,其中:
在一个实施例中,音频信息转换模块还用于获取音频信息并将音频信息中的杂音进行预处理;将预处理后的音频信息切分成预设时间长度的短帧音频;使用预设的窗函数对短帧音频进行优化操作;将经过窗函数优化后的短帧音频进行离散傅里叶变换并获取每帧对应的频谱信息;将所述频谱信息进行过滤和对数压缩并获取优化频谱;基于优化频谱进行离散余弦变换并获取频域特征信息。
在一个实施例中,文本序列排列模块还用于,收集弱监督数据;针对所述弱监督数据进行清洗和降噪的预处理;将预处理后的弱监督数据输入到所述声学模型和预设的语言模型中并输出对应的文本序列;通过弱监督数据对所述声学模型和预设的语言模型进行训练直至弱监督数据与生成的文本序列的匹配度达到预设的匹配范围内;基于所述声学模型和预设的语言模型计算文本序列的最佳排列。
在一个实施例中,摄像信息判定模块还用于,获取摄像图片信息;若所述摄像图片信息为人脸信息,则获取人脸关键点;基于人脸关键点对摄像图片信息进行几何校正和光学矫正;获取几何校正和光学校正后的摄像图片信息并提取校正人脸关键点;将所述校正人脸关键点与预设的人脸关键点进行比对;若校正人脸关键点与预设的人脸关键点不同,则发送与人员异常的报警信息。
在一个实施例中,摄像信息判定模块还用于,若所述摄像图片为人体信息,则获取人体关键点;判断人体关键点之间是否相互接触;若人体关键点之间相互接触,则在预设的异常行为库中查询对应的异常关键点,所述异常行为库中储存有不同的异常行为以及与异常行为相对应的异常关键点;若相互接触的人体关键点与异常关键点相匹配,则发送与异常行为相关的警报信息。
在一个实施例中,摄像信息判定模块还用于,根据最佳排列的文本序列筛选出场景关键词;将所述场景关键词与预设的场景库中的标准关键词进行比对,所述场景库中储存有不同的标准关键词以及与标准关键词相对应的场景信息;若场景关键词与标准关键词相匹配,则获取对应的场景信息,所述场景信息中包含有对应的报警阈值;若所述若最佳排列的文本序列与预设的违规关键词的匹配程度位于报警阈值内,则在预设的告警库中不发送与违规关键词对应的警报信息;否则,在预设的告警库中发送与违规关键词对应的警报信息。
上述评标违规行为检测方法装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种电能质量数据查询展示方法。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种评标违规行为检测方法,其特征在于,所述方法包括:
获取音频信息并将所述音频信息转换为频域特征信息;
通过循环神经网络建立声学模型将频域特征信息映射到文本序列;
基于所述声学模型和预设的语言模型计算文本序列的最佳排列;
若最佳排列的文本序列与预设的违规关键词相匹配,则在预设的告警库中发送与违规关键词对应的警报信息,所述告警库中储存有不同的违规关键词以及与违规关键词相对应警报信息。
2.根据权利要求1所述的方法,其特征在于,所述获取音频信息并将所述音频信息转换为频域特征信息包括:
获取音频信息并将音频信息中的杂音进行预处理;
将预处理后的音频信息切分成预设时间长度的短帧音频;
使用预设的窗函数对短帧音频进行优化操作;
将经过窗函数优化后的短帧音频进行离散傅里叶变换并获取每帧对应的频谱信息;
将所述频谱信息进行过滤和对数压缩并获取优化频谱;
基于优化频谱进行离散余弦变换并获取频域特征信息。
3.根据权利要求1所述的方法,其特征在于,所述基于所述声学模型和预设的语言模型计算文本序列的最佳排列包括:
收集弱监督数据;
针对所述弱监督数据进行清洗和降噪的预处理;
将预处理后的弱监督数据输入到所述声学模型和预设的语言模型中并输出对应的文本序列;
通过弱监督数据对所述声学模型和预设的语言模型进行训练直至弱监督数据与生成的文本序列的匹配度达到预设的匹配范围内;
基于所述声学模型和预设的语言模型计算文本序列的最佳排列。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取摄像图片信息;
若所述摄像图片信息为人脸信息,则获取人脸关键点;
基于人脸关键点对摄像图片信息进行几何校正和光学矫正;
获取几何校正和光学校正后的摄像图片信息并提取校正人脸关键点;
将所述校正人脸关键点与预设的人脸关键点进行比对;
若校正人脸关键点与预设的人脸关键点不同,则发送与人员异常的报警信息。
5.根据权利要求1所述的方法,其特征在于,在所述获取摄像图片信息之后,还包括:
若所述摄像图片为人体信息,则获取人体关键点;
判断人体关键点之间是否相互接触;
若人体关键点之间相互接触,则在预设的异常行为库中查询对应的异常关键点,所述异常行为库中储存有不同的异常行为以及与异常行为相对应的异常关键点;
若相互接触的人体关键点与异常关键点相匹配,则发送与异常行为相关的警报信息。
6.根据权利要求5所述的方法,其特征在于,所述在预设的告警库中发送与违规关键词对应的警报信息包括:
根据最佳排列的文本序列筛选出场景关键词;
将所述场景关键词与预设的场景库中的标准关键词进行比对,所述场景库中储存有不同的标准关键词以及与标准关键词相对应的场景信息;
若场景关键词与标准关键词相匹配,则获取对应的场景信息,所述场景信息中包含有对应的报警阈值;
若所述若最佳排列的文本序列与预设的违规关键词的匹配程度位于报警阈值内,则在预设的告警库中不发送与违规关键词对应的警报信息;
否则,在预设的告警库中发送与违规关键词对应的警报信息。
7.一种评标违规行为检测装置,其特征在于,所述装置包括:
音频信息转换模块,用于获取音频信息并将所述音频信息转换为频域特征信息;
文本序列映射模块,用于通过循环神经网络建立声学模型将频域特征信息映射到文本序列;
文本序列排列模块,用于基于所述声学模型和预设的语言模型计算文本序列的最佳排列;
报警信息发送模块,用于若最佳排列的文本序列与预设的违规关键词相匹配,则在预设的告警库中发送与违规关键词对应的警报信息,所述告警库中储存有不同的违规关键词以及与违规关键词相对应警报信息。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311623974.0A CN117611300A (zh) | 2023-11-28 | 2023-11-28 | 一种评标违规行为检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311623974.0A CN117611300A (zh) | 2023-11-28 | 2023-11-28 | 一种评标违规行为检测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117611300A true CN117611300A (zh) | 2024-02-27 |
Family
ID=89943980
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311623974.0A Pending CN117611300A (zh) | 2023-11-28 | 2023-11-28 | 一种评标违规行为检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117611300A (zh) |
-
2023
- 2023-11-28 CN CN202311623974.0A patent/CN117611300A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111062871B (zh) | 一种图像处理方法、装置、计算机设备及可读存储介质 | |
EP3839942A1 (en) | Quality inspection method, apparatus, device and computer storage medium for insurance recording | |
WO2020248387A1 (zh) | 基于多路摄像的人脸识别方法、装置、终端及存储介质 | |
CN110175526B (zh) | 狗情绪识别模型训练方法、装置、计算机设备及存储介质 | |
CN110390229B (zh) | 一种人脸图片筛选方法、装置、电子设备及存储介质 | |
CN111339813B (zh) | 人脸属性识别方法、装置、电子设备和存储介质 | |
US8842889B1 (en) | System and method for automatic face recognition | |
CN110991289A (zh) | 异常事件的监测方法、装置、电子设备及存储介质 | |
CN112597867A (zh) | 戴口罩人脸识别方法、系统、计算机设备及存储介质 | |
US9947323B2 (en) | Synthetic oversampling to enhance speaker identification or verification | |
CN111091845A (zh) | 音频处理方法、装置、终端设备及计算机存储介质 | |
CN109147798B (zh) | 语音识别方法、装置、电子设备及可读存储介质 | |
CN111401169A (zh) | 基于监控视频信息的供电营业厅服务人员行为识别方法 | |
CN109922311A (zh) | 基于音视频联动的监控方法、装置、终端及存储介质 | |
CN113255516A (zh) | 活体检测方法、装置和电子设备 | |
Mahajan et al. | Face detection on distorted images by using quality HOG features | |
CN116453232A (zh) | 人脸活体检测方法、人脸活体检测模型的训练方法和装置 | |
CN113158773A (zh) | 一种活体检测模型的训练方法及训练装置 | |
CN111932056A (zh) | 客服质量评分方法、装置、计算机设备和存储介质 | |
CN116884149A (zh) | 多模态信息分析的方法、装置、电子设备和介质 | |
CN117611300A (zh) | 一种评标违规行为检测方法及系统 | |
CN111669575B (zh) | 图像处理效果的测试方法、系统、电子设备、介质及终端 | |
CN115438725A (zh) | 一种状态检测方法、装置、设备和存储介质 | |
CN114973490A (zh) | 一种基于人脸识别的监控预警系统 | |
JP2007199750A (ja) | 画素群パラメータ算出方法及び目標物検出方法並びに画素群パラメータ算出装置及び目標物検出装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |