CN113554077A - 基于多模态神经网络模型的工况评估及业务量预测方法 - Google Patents

基于多模态神经网络模型的工况评估及业务量预测方法 Download PDF

Info

Publication number
CN113554077A
CN113554077A CN202110787311.7A CN202110787311A CN113554077A CN 113554077 A CN113554077 A CN 113554077A CN 202110787311 A CN202110787311 A CN 202110787311A CN 113554077 A CN113554077 A CN 113554077A
Authority
CN
China
Prior art keywords
layer
training
parameters
transformation
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110787311.7A
Other languages
English (en)
Inventor
张洁
胡振
刘自成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Zhiying Artificial Intelligence Research Institute Co ltd
Nanjing Xuanying Network Technology Co ltd
Original Assignee
Nanjing Zhiying Artificial Intelligence Research Institute Co ltd
Nanjing Xuanying Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Zhiying Artificial Intelligence Research Institute Co ltd, Nanjing Xuanying Network Technology Co ltd filed Critical Nanjing Zhiying Artificial Intelligence Research Institute Co ltd
Priority to CN202110787311.7A priority Critical patent/CN113554077A/zh
Publication of CN113554077A publication Critical patent/CN113554077A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • Biophysics (AREA)
  • Game Theory and Decision Science (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Technology Law (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)

Abstract

本发明公开了基于多模态神经网络模型的工况评估及业务量预测方法,该评估方法包括以下步骤:采集运行状态;构造多模态神经网络;将各模块状态依次输入时序编码层;将各模块状态整体输入批量编码层;进行局部变换和全局变换,得到评估值;对网络进行整体训练;该预测方法包括以下步骤:获取预测的数据;构造多模态神经网络;将各模块状态依次输入时序编码层;将各模块状态整体输入批量编码层;进行局部变换和全局变换,得到业务量预测值;对网络进行整体训练。有益效果:不仅可以大幅提高自助文书填写终端的服务效能,而且还可以最大化诉讼服务处置资源使用效率,最大程度为人民群众提供诉讼服务便利。

Description

基于多模态神经网络模型的工况评估及业务量预测方法
技术领域
本发明涉及评估及预测技术领域,具体来说,涉及基于多模态神经网络模型的工况评估及业务量预测方法。
背景技术
高速、连续及高度自动化是21世纪设备的运行特征,为了保持设备安全、可靠地运行,需要随时了解设备的运行状况及精度保持,必须对重大设备及系统进行状态监测,工况评估,适时维修及在线诊断,离线修复等一整套科学管理。例如专利号CN201210066256.3公开了一种六氟化硫变压器运行工况评估方法,其有效地解决了目前工况评估中试验流程繁杂,周期较长,数据更新慢,无法实时监测气体组份数据来对六氟化硫变压器的健康状况进行评估,效率低,耗费人力、物力及财力,无法满足六氟化硫变压器的运行工况评估的问题,虽然其可以对于大量的六氟化硫变压器的工况能够实时进行自动化的分析评估,但是其不能对设备的运行状态进行预测,从而无法更好地满足企业的使用需求。
近年来,随着老百姓知识水平与法律维权意识的全面提升,法院立案人数逐年上升。因此,为了缓解了从业人员的工作压力,自助终端设备引入诉服大厅,而为了保持自助终端设备安全、可靠的运行需要实时的设备的运行状态。对于法院自助终端工况评估这一问题而言,由于不同的诉服装备之间存在着功能兼容的情况,且兼容性是有向的,如立案终端可以满足填单功能,而填单终端不可以满足立案功能,不同终端数量特征的重要性是不一样的,因此考虑综合时序编码(J.Schmidhuber 1997)和批量编码(P.Vincent 2010)的结构用于评估法院自助文书填写终端的工作状况及预测法院诉讼服务大厅业务量。
此外,在诉讼服务环节,随着智能诉讼服务终端、外包服务人员等诉讼服务处置资源介入到相关诉讼服务工作中,如何最大限度地发挥这些处置资源,尤其是智能诉讼服务终端的使用效率,成为提高司法效率,让人民群众感受到公平正义的重要问题。为了更好地调配资源,次日的业务量预测是重要的基础,本发明提出用多模态神经网络模型来进行设备工况的评估及相关业务量的预测。
发明内容
针对相关技术中的问题,本发明提出基于多模态神经网络模型的工况评估及业务量预测方法,以克服现有相关技术所存在的上述技术问题。
为此,本发明采用的具体技术方案如下:
根据本发明的一个方面,提供了基于多模态神经网络模型的工况评估方法,该评估方法包括以下步骤:
S1、采集自助文书填写终端模块的运行状态;
S2、构造分别由时序编码层、批量编码层、局部变换层及全局变换层组成的多模态神经网络;
S3、将自助文书填写终端的各模块状态依次输入以长短时记忆模型为核心的时序编码层;
S4、将自助文书填写终端的各模块状态整体输入至以自编码器为核心的批量编码层;
S5、对时序编码结果及批量编码结果依次进行局部变换和全局变换,得到设备状态的评估值;
S6、利用法院自助文书填写终端的历史维护信息对网络进行整体训练。
进一步的,所述S1中自助文书填写终端模块包括二代身份证阅读器异常、话筒异常、条码扫描器异常、高扫扫描失败、摄像头异常、打印机缺墨、打印机卡纸、打印机缺纸、模块检测异常、断网、异常关机、加密狗验证失败、加密狗未插入、授权文件异常、服务器授权文件异常、文书填写失败、页面错位、页面数据缺少及其他。
进一步的,所述S4中自编码器采取三层编码的结构,编码输出节点为28个,采用均方误差为目标函数来进行预训练;所述批量编码层各参数如下:
输入层节点数:19个;
中间层节点数:400、300个;
输出层节点数:28个;
预训练优化目标:均方误差,
Figure BDA0003159515230000031
其中x为原始输入,
Figure BDA0003159515230000032
为自编码器恢复的输入;
初始化参数:
Figure BDA0003159515230000033
其中
Figure BDA0003159515230000034
为第k层第i行第j列的权重,
Figure BDA0003159515230000035
为第k层第i行的输入偏置量,
Figure BDA0003159515230000036
为第k层第j行的输出偏置量,N(0,0.06)表示均值为0,标准差为0.06的正态分布;
预训练步长:
Figure BDA0003159515230000037
其中n为迭代次数;
预训练退出条件:e<0.01或n≥10000,即均方误差小于等于0.01或迭代次数大于等于10000次。
进一步的,所述S5中所有的局部变换和全局变换的参数均为独立参数,局部变换和全局变换均为3层神经网络,采用受限玻尔兹曼机模型进行预训练;局部变换和全局变换的预训练参数设置如下:
局部变换输入层节点数:28个;
全局变换输入层节点数:512个;
局部变换输出层节点数:256个;
全局变换输出层节点数:7;
局部变换中间层节点数:1024、512个;
全局变换中间层节点数:1024、256个;
预训练方式:采用受限玻尔兹曼机预训练算法来计算迭代更新方向;
初始化参数:
Figure BDA0003159515230000038
其中
Figure BDA0003159515230000039
为第k层第i行第j列的权重,
Figure BDA00031595152300000310
为第k层第i行的输入偏置量,
Figure BDA00031595152300000311
为第k层第j行的输出偏置量,N(0,0.02)表示均值为0,标准差为0.02的正态分布;
预训练步长:
Figure BDA00031595152300000312
其中n为迭代次数;
预训练退出条件:n≥10000,即迭代次数大于等于10000次。
进一步的,所述S6中整体训练的参数如下:
迭代步长:lr=10-4
目标函数:均方误差,即
Figure BDA00031595152300000313
其中
Figure BDA00031595152300000314
为真实标签,yi为模型给出的标签;
迭代退出条件:验证集残差小于err=10-3
遗忘参数:θ=0.3;
矩参数:α=0.5;
输出层节点的激活函数:符号函数,即
Figure BDA0003159515230000041
其中ei为第i个输出层节点的激活值。
根据本发明的另一个方面,提供了基于多模态神经网络模型的业务量预测方法,该预测方法包括以下步骤:
S1、获取法院诉讼服务大厅各种设备中用于预测的数据;
S2、构造由时序编码层、批量编码层、局部变换层及全局变换层组成的多模态神经网络,并用于预测各种设备的次日使用量;
S3、将诉讼服务大厅各种设备的各模块状态依次输入以长短时记忆模型为核心的时序编码层;
S4、将诉讼服务大厅各种设备的各模块状态整体输入至以自编码器为核心的批量编码层;
S5、对时序编码结果及批量编码结果依次进行局部变换和全局变换,得到各诉讼服务终端业务量预测值;
S6、利用每日办理业务的人数历史数据对网络进行整体训练。
进一步的,所述S1中的数据包括法院诉讼服务大厅各种设备的本周使用量、上月同期使用量、去年同期使用量及调解数据。
进一步的,所述S4中自编码器采取三层编码的结构,编码输出节点为32个,采用均方误差为目标函数来进行预训练;所述批量编码层各参数如下:
输入层节点数:视实际情况而定;
中间层节点数:400、300个;
输出层节点数:32个;
预训练优化目标:均方误差,
Figure BDA0003159515230000042
其中x为原始输入,
Figure BDA0003159515230000043
为自编码器恢复的输入;
初始化参数:
Figure BDA0003159515230000051
其中
Figure BDA0003159515230000052
为第k层第i行第j列的权重,
Figure BDA0003159515230000053
为第k层第i行的输入偏置量,
Figure BDA0003159515230000054
为第k层第j行的输出偏置量,N(0,0.06)表示均值为0,标准差为0.06的正态分布;
预训练步长:
Figure BDA0003159515230000055
其中n为迭代次数;
预训练退出条件:e≤0.01或n≥10000,即均方误差小于等于0.01或迭代次数大于等于10000次。
进一步的,所述S5中所有局部变换和全局变换的参数均为独立参数,局部变换和全局变换均为3层神经网络,采用受限玻尔兹曼机模型进行预训练;局部变换和全局变换的预训练参数设置如下:
局部变换输入层节点数:32个;
全局变换输入层节点数:512个;
局部变换输出层节点数:256个;
全局变换输出层节点数:视实际情况而定;
局部变换中间层节点数:1024、512个;
全局变换中间层节点数:1024、256个;
预训练方式:采用受限玻尔兹曼机预训练算法来计算迭代更新方向;
初始化参数:
Figure BDA0003159515230000056
其中
Figure BDA0003159515230000057
为第k层第i行第j列的权重,
Figure BDA0003159515230000058
为第k层第i行的输入偏置量,
Figure BDA0003159515230000059
为第k层第j行的输出偏置量,N(0,0.02)表示均值为0,标准差为0.02的正态分布;
预训练步长:
Figure BDA00031595152300000510
其中n为迭代次数;
预训练退出条件:n≥10000,即迭代次数大于等于10000次。
进一步的,所述S6中整体训练的参数如下:
迭代步长:lr=10-3
目标函数:均方误差,即
Figure BDA00031595152300000511
其中
Figure BDA00031595152300000512
为真实的各种设备使用的次数,yi为模型给出的各种设备使用的次数;
迭代退出条件:验证集残差小于err=10-3
遗忘参数:θ=0.1;
矩参数:α=0.8;
输出层节点的激活函数:线性函数,即yi=ei,其中ei为第i个输出层节点的激活值。
本发明的有益效果为:本发明不仅可以通过利用多模态神经网络进行自助文书填写终端的工况评估,可有效降低法院自助文书填写终端的异常恢复时长,大幅提高自助文书填写终端的服务效能,而且还可以利用多模态神经网络预测次日法院诉讼服务大厅业务量,可有效降低法院诉讼服务大厅业务量的预测误差,指导诉讼服务处置资源的协同调度,最大化诉讼服务处置资源使用效率,最大程度为人民群众提供诉讼服务便利。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的基于多模态神经网络模型的工况评估方法的网络结构图;
图2是根据本发明实施例的基于多模态神经网络模型的工况评估方法中批量编码层预训练示意图;
图3是根据本发明实施例的基于多模态神经网络模型的工况评估方法中局部变换层和全局变换层预训练示意图;
图4是根据本发明实施例的基于多模态神经网络模型的工况评估方法中模型上线后同期对比的故障相应时间对比示意图;
图5是根据本发明另一实施例的基于多模态神经网络模型的业务量预测方法的网络结构图;
图6是根据本发明另一实施例的基于多模态神经网络模型的业务量预测方法中批量编码层预训练示意图;
图7是根据本发明另一实施例的基于多模态神经网络模型的业务量预测方法中局部变换层和全局变换层预训练示意图;
图8是根据本发明另一实施例的基于多模态神经网络模型的业务量预测方法中模型上线后调解终端预测业务量和实际业务量对比示意图;
图9是根据本发明另一实施例的基于多模态神经网络模型的业务量预测方法中模型上线后立案终端预测业务量和实际业务量对比示意图;
图10是根据本发明另一实施例的基于多模态神经网络模型的业务量预测方法中模型上线后填单终端预测业务量和实际业务量对比示意图;
图11是根据本发明另一实施例的基于多模态神经网络模型的业务量预测方法中模型上线后材料终端预测业务量和实际业务量对比示意图。
具体实施方式
为进一步说明各实施例,本发明提供有附图,这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理,配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点,图中的组件并未按比例绘制,而类似的组件符号通常用来表示类似的组件。
根据本发明的实施例,提供了基于多模态神经网络模型的工况评估及业务量预测方法。
现结合附图和具体实施方式对本发明进一步说明,如图1-图4所示,根据本发明的一个方面,提供了基于多模态神经网络模型的工况评估方法,该评估方法包括以下步骤:
S1、采集自助文书填写终端模块的运行状态;
其中,自助文书填写终端模块包括二代身份证阅读器异常、话筒异常、条码扫描器异常、高扫扫描失败、摄像头异常、打印机缺墨、打印机卡纸、打印机缺纸、模块检测异常、断网、异常关机、加密狗验证失败、加密狗未插入、授权文件异常、服务器授权文件异常、文书填写失败、页面错位、页面数据缺少及其他。
具体的,自助文书填写终端模块及其标识如下表所示:
序号 模块名 模块标识 编码规则
1 二代身份证阅读器异常 AIC +1正常,-1异常
2 话筒异常 AMH +1正常,-1异常
3 条码扫描器异常 AQC +1正常,-1异常
4 高扫扫描失败 AHS +1正常,-1异常
5 摄像头异常 AC +1正常,-1异常
6 打印机缺墨 PSI +1正常,-1异常
7 打印机卡纸 PPJ +1正常,-1异常
8 打印机缺纸 POP +1正常,-1异常
9 模块检测异常 AMD +1正常,-1异常
10 断网 AD +1正常,-1异常
11 异常关机 AS +1正常,-1异常
12 加密狗验证失败 DVF +1正常,-1异常
13 加密狗未插入 DHI +1正常,-1异常
14 授权文件异常 AFE +1正常,-1异常
15 服务器授权文件异常 SAFE +1正常,-1异常
16 文书填写失败 FCF +1正常,-1异常
17 页面错位 PD +1正常,-1异常
18 页面数据缺少 PDS +1正常,-1异常
19 其他 O +1正常,-1异常
S2、构造分别由时序编码层、批量编码层、局部变换层及全局变换层组成的多模态神经网络;确定了用于法院自助文书填写终端工况评估的多模态神经网络模型结构;
S3、将自助文书填写终端的各模块状态依次输入以长短时记忆模型为核心的时序编码层;确定了时序编码层的参数和结构;
本实施例中采用28个长短时记忆模型扩增来实现时序编码,即输入层依次独立输入至每一个长短时记忆模型中,每个模型仅初始参数不同,最终将28个模型的输出整体作为时序编码结果。时序编码层直接随整体模型进行训练,不需要额外进行预训练。
S4、将自助文书填写终端的各模块状态整体输入至以自编码器为核心的批量编码层;确定了批量编码层的参数和结构以及预训练方法;
其中,自编码器采取三层编码的结构,编码输出节点为28个,采用均方误差为目标函数来进行预训练;所述批量编码层各参数如下:
输入层节点数:19个;
中间层节点数:400、300个;
输出层节点数:28个;
预训练优化目标:均方误差,
Figure BDA0003159515230000091
其中x为原始输入,
Figure BDA0003159515230000092
为自编码器恢复的输入;
初始化参数:
Figure BDA0003159515230000093
其中
Figure BDA0003159515230000094
为第k层第i行第j列的权重,
Figure BDA0003159515230000095
为第k层第i行的输入偏置量,
Figure BDA0003159515230000096
为第k层第j行的输出偏置量,N(0,0.06)表示均值为0,标准差为0.06的正态分布;
预训练步长:
Figure BDA0003159515230000097
其中n为迭代次数;
预训练退出条件:e≤0.01或n≥10000,即均方误差小于等于0.01或迭代次数大于等于10000次。
S5、对时序编码结果及批量编码结果依次进行局部变换和全局变换,得到设备状态的评估值;确定了局部变换层和全局变换层的参数、结构以及预训练方法。
其中,所有的局部变换和全局变换的参数均为独立参数,局部变换和全局变换均为3层神经网络,采用受限玻尔兹曼机模型进行预训练;局部变换和全局变换的预训练参数设置如下:
局部变换输入层节点数:28个;
全局变换输入层节点数:512个;
局部变换输出层节点数:256个;
全局变换输出层节点数:7;
局部变换中间层节点数:1024、512个;
全局变换中间层节点数:1024、256个;
预训练方式:采用受限玻尔兹曼机预训练算法来计算迭代更新方向;
初始化参数:
Figure BDA0003159515230000101
其中
Figure BDA0003159515230000102
为第k层第i行第j列的权重,
Figure BDA0003159515230000103
为第k层第i行的输入偏置量,
Figure BDA0003159515230000104
为第k层第j行的输出偏置量,N(0,0.02)表示均值为0,标准差为0.02的正态分布;
预训练步长:
Figure BDA0003159515230000105
其中n为迭代次数;
预训练退出条件:n≥10000,即迭代次数大于等于10000次。
S6、利用法院自助文书填写终端的历史维护信息对网络进行整体训练。
其中,整体训练的参数如下:
迭代步长:lr=10-4
目标函数:均方误差,即
Figure BDA0003159515230000106
其中
Figure BDA0003159515230000107
为真实标签,yi为模型给出的标签;
迭代退出条件:验证集残差小于err=10-3
遗忘参数:θ=0.3;
矩参数:α=0.5;
输出层节点的激活函数:符号函数,即
Figure BDA0003159515230000108
其中ei为第i个输出层节点的激活值。
根据本发明的另一个方面,如图5-图11所示,提供了基于多模态神经网络模型的业务量预测方法,该预测方法包括以下步骤:
S1、获取法院诉讼服务大厅各种设备中用于预测的数据;从本周、上月、去年同期和调解数据四个方面确定了用于预测的参数;
其中,数据包括法院诉讼服务大厅各种设备的本周使用量、上月同期使用量、去年同期使用量及调解数据。
具体的,本周使用量指各种设备当周的使用量,包括当日的使用量和本周日均使用量;
上月同期使用量指过去四周各种设备每周使用量的峰值、谷值和平均值以及过去四周各种设备每周同日的使用量;
去年同期使用量指去年同周次及前后各1周各种设备使用量的峰值、谷值、平均值和同日使用量;
调解数据指前15个工作日内调解案件数量。各种设备指部署在具体法院的设备。
S2、构造由时序编码层、批量编码层、局部变换层及全局变换层组成的多模态神经网络,并用于预测各种设备的次日使用量;
确定了用于法院诉讼服务大厅业务量的多模态神经网络模型结构,该模型由时序编码层、批量编码层、局部变换层、全局变换层和输出层组成;
S3、将诉讼服务大厅各种设备的各模块状态依次输入以长短时记忆模型为核心的时序编码层;确定了时序编码层的结构;
本实施例中采用32个长短时记忆模型扩增来实现时序编码,即输入层依次独立输入至每一个长短时记忆模型中,每个模型仅初始参数不同,最终将32个模型的输出整体作为时序编码结果。时序编码层直接随整体模型进行训练,不需要额外进行预训练。
S4、将诉讼服务大厅各种设备的各模块状态整体输入至以自编码器为核心的批量编码层;确定了批量编码层的参数、结构以及预训练方法;
其中,自编码器采取三层编码的结构,编码输出节点为32个,采用均方误差为目标函数来进行预训练;所述批量编码层各参数如下:
输入层节点数:视实际情况而定;
中间层节点数:400、300个;
输出层节点数:32个;
预训练优化目标:均方误差,
Figure BDA0003159515230000111
其中x为原始输入,
Figure BDA0003159515230000112
为自编码器恢复的输入;
初始化参数:
Figure BDA0003159515230000121
其中
Figure BDA0003159515230000122
为第k层第i行第j列的权重,
Figure BDA0003159515230000123
为第k层第i行的输入偏置量,
Figure BDA0003159515230000124
为第k层第j行的输出偏置量,N(0,0.06)表示均值为0,标准差为0.06的正态分布;
预训练步长:
Figure BDA0003159515230000125
其中n为迭代次数;
预训练退出条件:e≤0.01或n≥10000,即均方误差小于等于0.01或迭代次数大于等于10000次。
S5、对时序编码结果及批量编码结果依次进行局部变换和全局变换,得到各诉讼服务终端业务量预测值;确定了局部变换层和全局变换层的参数、结构以及预训练方法;
其中,所有局部变换和全局变换的参数均为独立参数,局部变换和全局变换均为3层神经网络,采用受限玻尔兹曼机模型进行预训练;局部变换和全局变换的预训练参数设置如下:
局部变换输入层节点数:32个;
全局变换输入层节点数:512个;
局部变换输出层节点数:256个;
全局变换输出层节点数:视实际情况而定;
局部变换中间层节点数:1024、512个;
全局变换中间层节点数:1024、256个;
预训练方式:采用受限玻尔兹曼机预训练算法来计算迭代更新方向;
初始化参数:
Figure BDA0003159515230000126
其中
Figure BDA0003159515230000127
为第k层第i行第j列的权重,
Figure BDA0003159515230000128
为第k层第i行的输入偏置量,
Figure BDA0003159515230000129
为第k层第j行的输出偏置量,N(0,0.02)表示均值为0,标准差为0.02的正态分布;
预训练步长:
Figure BDA00031595152300001210
其中n为迭代次数;
预训练退出条件:n≥10000,即迭代次数大于等于10000次。
S6、利用每日办理业务的人数历史数据对网络进行整体训练。
其中,整体训练的参数如下:
迭代步长:lr=10-3
目标函数:均方误差,即
Figure BDA0003159515230000131
其中
Figure BDA0003159515230000132
为真实的各种设备使用的次数,yi为模型给出的各种设备使用的次数;
迭代退出条件:验证集残差小于err=10-3
遗忘参数:θ=0.1;
矩参数:α=0.8;
输出层节点的激活函数:线性函数,即yi=ei,其中ei为第i个输出层节点的激活值。
综上所述,借助于本发明的上述技术方案,本发明不仅可以通过利用多模态神经网络进行自助文书填写终端的工况评估,可有效降低法院自助文书填写终端的异常恢复时长,大幅提高自助文书填写终端的服务效能,而且还可以利用多模态神经网络预测次日法院诉讼服务大厅业务量,可有效降低法院诉讼服务大厅业务量的预测误差,指导诉讼服务处置资源的协同调度,最大化诉讼服务处置资源使用效率,最大程度为人民群众提供诉讼服务便利。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.基于多模态神经网络模型的工况评估方法,其特征在于,该评估方法包括以下步骤:
S1、采集自助文书填写终端模块的运行状态;
S2、构造分别由时序编码层、批量编码层、局部变换层及全局变换层组成的多模态神经网络;
S3、将自助文书填写终端的各模块状态依次输入以长短时记忆模型为核心的时序编码层;
S4、将自助文书填写终端的各模块状态整体输入至以自编码器为核心的批量编码层;
S5、对时序编码结果及批量编码结果依次进行局部变换和全局变换,得到设备状态的评估值;
S6、利用法院自助文书填写终端的历史维护信息对网络进行整体训练。
2.根据权利要求1所述的基于多模态神经网络模型的工况评估方法,其特征在于,所述S1中自助文书填写终端模块包括二代身份证阅读器异常、话筒异常、条码扫描器异常、高扫扫描失败、摄像头异常、打印机缺墨、打印机卡纸、打印机缺纸、模块检测异常、断网、异常关机、加密狗验证失败、加密狗未插入、授权文件异常、服务器授权文件异常、文书填写失败、页面错位、页面数据缺少及其他。
3.根据权利要求1所述的基于多模态神经网络模型的工况评估方法,其特征在于,所述S4中自编码器采取三层编码的结构,编码输出节点为28个,采用均方误差为目标函数来进行预训练;所述批量编码层各参数如下:
输入层节点数:19个;
中间层节点数:400、300个;
输出层节点数:28个;
预训练优化目标:均方误差,
Figure FDA0003159515220000011
其中x为原始输入,
Figure FDA0003159515220000012
为自编码器恢复的输入;
初始化参数:
Figure FDA0003159515220000013
其中
Figure FDA0003159515220000014
为第k层第i行第j列的权重,
Figure FDA0003159515220000015
为第k层第i行的输入偏置量,
Figure FDA0003159515220000016
为第k层第j行的输出偏置量,N(0,0.06)表示均值为0,标准差为0.06的正态分布;
预训练步长:
Figure FDA0003159515220000021
其中n为迭代次数;
预训练退出条件:e≤0.01或n≥10000,即均方误差小于等于0.01或迭代次数大于等于10000次。
4.根据权利要求1所述的基于多模态神经网络模型的工况评估方法,其特征在于,所述S5中所有的局部变换和全局变换的参数均为独立参数,局部变换和全局变换均为3层神经网络,采用受限玻尔兹曼机模型进行预训练;局部变换和全局变换的预训练参数设置如下:
局部变换输入层节点数:28个;
全局变换输入层节点数:512个;
局部变换输出层节点数:256个;
全局变换输出层节点数:7;
局部变换中间层节点数:1024、512个;
全局变换中间层节点数:1024、256个;
预训练方式:采用受限玻尔兹曼机预训练算法来计算迭代更新方向;
初始化参数:
Figure FDA0003159515220000022
其中
Figure FDA0003159515220000023
为第k层第i行第j列的权重,
Figure FDA0003159515220000024
为第k层第i行的输入偏置量,
Figure FDA0003159515220000025
为第k层第j行的输出偏置量,N(0,0.02)表示均值为0,标准差为0.02的正态分布;
预训练步长:
Figure FDA0003159515220000026
其中n为迭代次数;
预训练退出条件:n≥10000,即迭代次数大于等于10000次。
5.根据权利要求1所述的基于多模态神经网络模型的工况评估方法,其特征在于,所述S6中整体训练的参数如下:
迭代步长:lr=10-4
目标函数:均方误差,即
Figure FDA0003159515220000027
其中
Figure FDA0003159515220000028
为真实标签,yi为模型给出的标签;
迭代退出条件:验证集残差小于err=10-3
遗忘参数:θ=0.3;
矩参数:α=0.5;
输出层节点的激活函数:符号函数,即
Figure FDA0003159515220000031
其中ei为第i个输出层节点的激活值。
6.基于多模态神经网络模型的业务量预测方法,其特征在于,该预测方法包括以下步骤:
S1、获取法院诉讼服务大厅各种设备中用于预测的数据;
S2、构造由时序编码层、批量编码层、局部变换层及全局变换层组成的多模态神经网络,并用于预测各种设备的次日使用量;
S3、将诉讼服务大厅各种设备的各模块状态依次输入以长短时记忆模型为核心的时序编码层;
S4、将诉讼服务大厅各种设备的各模块状态整体输入至以自编码器为核心的批量编码层;
S5、对时序编码结果及批量编码结果依次进行局部变换和全局变换,得到各诉讼服务终端业务量预测值;
S6、利用每日办理业务的人数历史数据对网络进行整体训练。
7.根据权利要求6所述的基于多模态神经网络模型的业务量预测方法,其特征在于,所述S1中的数据包括法院诉讼服务大厅各种设备的本周使用量、上月同期使用量、去年同期使用量及调解数据。
8.根据权利要求6所述的基于多模态神经网络模型的业务量预测方法,其特征在于,所述S4中自编码器采取三层编码的结构,编码输出节点为32个,采用均方误差为目标函数来进行预训练;所述批量编码层各参数如下:
中间层节点数:400、300个;
输出层节点数:32个;
预训练优化目标:均方误差,
Figure FDA0003159515220000032
其中x为原始输入,
Figure FDA0003159515220000033
为自编码器恢复的输入;
初始化参数:
Figure FDA0003159515220000034
其中
Figure FDA0003159515220000035
为第k层第i行第j列的权重,
Figure FDA0003159515220000041
为第k层第i行的输入偏置量,
Figure FDA0003159515220000042
为第k层第j行的输出偏置量,N(0,0.06)表示均值为0,标准差为0.06的正态分布;
预训练步长:
Figure FDA0003159515220000043
其中n为迭代次数;
预训练退出条件:e≤0.01或n≥10000,即均方误差小于等于0.01或迭代次数大于等于10000次。
9.根据权利要求6所述的基于多模态神经网络模型的业务量预测方法,其特征在于,所述S5中所有局部变换和全局变换的参数均为独立参数,局部变换和全局变换均为3层神经网络,采用受限玻尔兹曼机模型进行预训练;局部变换和全局变换的预训练参数设置如下:
局部变换输入层节点数:32个;
全局变换输入层节点数:512个;
局部变换输出层节点数:256个;
局部变换中间层节点数:1024、512个;
全局变换中间层节点数:1024、256个;
预训练方式:采用受限玻尔兹曼机预训练算法来计算迭代更新方向;
初始化参数:
Figure FDA0003159515220000044
其中
Figure FDA0003159515220000045
为第k层第i行第j列的权重,
Figure FDA0003159515220000046
为第k层第i行的输入偏置量,
Figure FDA0003159515220000047
为第k层第j行的输出偏置量,N(0,0.02)表示均值为0,标准差为0.02的正态分布;
预训练步长:
Figure FDA0003159515220000048
其中n为迭代次数;
预训练退出条件:n≥10000,即迭代次数大于等于10000次。
10.根据权利要求6所述的基于多模态神经网络模型的业务量预测方法,其特征在于,所述S6中整体训练的参数如下:
迭代步长:lr=10-3
目标函数:均方误差,即
Figure FDA0003159515220000049
其中
Figure FDA00031595152200000410
为真实的各种设备使用的次数,yi为模型给出的各种设备使用的次数;
迭代退出条件:验证集残差小于err=10-3
遗忘参数:θ=0.1;
矩参数:α=0.8;
输出层节点的激活函数:线性函数,即yi=ei,其中ei为第i个输出层节点的激活值。
CN202110787311.7A 2021-07-13 2021-07-13 基于多模态神经网络模型的工况评估及业务量预测方法 Pending CN113554077A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110787311.7A CN113554077A (zh) 2021-07-13 2021-07-13 基于多模态神经网络模型的工况评估及业务量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110787311.7A CN113554077A (zh) 2021-07-13 2021-07-13 基于多模态神经网络模型的工况评估及业务量预测方法

Publications (1)

Publication Number Publication Date
CN113554077A true CN113554077A (zh) 2021-10-26

Family

ID=78131637

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110787311.7A Pending CN113554077A (zh) 2021-07-13 2021-07-13 基于多模态神经网络模型的工况评估及业务量预测方法

Country Status (1)

Country Link
CN (1) CN113554077A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117407754A (zh) * 2023-10-27 2024-01-16 北京中科闻歌科技股份有限公司 一种多模态大模型训练策略确定方法、电子设备及介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107132516A (zh) * 2017-05-16 2017-09-05 电子科技大学 一种基于深度置信网络的雷达一维距离像目标识别方法
WO2017206936A1 (zh) * 2016-06-02 2017-12-07 腾讯科技(深圳)有限公司 基于机器学习的网络模型构造方法及装置
US20170372201A1 (en) * 2016-06-22 2017-12-28 Massachusetts Institute Of Technology Secure Training of Multi-Party Deep Neural Network
CN108280757A (zh) * 2017-02-13 2018-07-13 腾讯科技(深圳)有限公司 用户信用评估方法及装置
CN108520080A (zh) * 2018-05-11 2018-09-11 武汉理工大学 船舶柴油发电机故障预测与健康状态在线评估系统及方法
CN109492838A (zh) * 2019-01-16 2019-03-19 中国地质大学(武汉) 一种基于深度循环神经网络的股指价格预测方法
CN109816095A (zh) * 2019-01-14 2019-05-28 湖南大学 基于改进门控循环神经网络的网络流量预测方法
WO2019204186A1 (en) * 2018-04-18 2019-10-24 Sony Interactive Entertainment Inc. Integrated understanding of user characteristics by multimodal processing
CN110503204A (zh) * 2018-05-17 2019-11-26 国际商业机器公司 识别用于机器学习任务的迁移模型
CN111489803A (zh) * 2020-03-31 2020-08-04 重庆金域医学检验所有限公司 基于自回归模型的报告单编码模型生成方法、系统和设备
CN112102135A (zh) * 2020-09-10 2020-12-18 重庆商务职业学院 基于lstm神经网络的高校贫困生精准资助模型
CN112561165A (zh) * 2020-12-16 2021-03-26 南京航空航天大学 一种基于组合模型的多维时序数据预测方法
CN112835770A (zh) * 2021-04-22 2021-05-25 南京铉盈网络科技有限公司 基于稠密神经网络模型的法院自助阅卷终端工况评估方法
CN113076235A (zh) * 2021-04-09 2021-07-06 中山大学 一种基于状态融合的时序异常检测方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017206936A1 (zh) * 2016-06-02 2017-12-07 腾讯科技(深圳)有限公司 基于机器学习的网络模型构造方法及装置
US20170372201A1 (en) * 2016-06-22 2017-12-28 Massachusetts Institute Of Technology Secure Training of Multi-Party Deep Neural Network
CN108280757A (zh) * 2017-02-13 2018-07-13 腾讯科技(深圳)有限公司 用户信用评估方法及装置
CN107132516A (zh) * 2017-05-16 2017-09-05 电子科技大学 一种基于深度置信网络的雷达一维距离像目标识别方法
WO2019204186A1 (en) * 2018-04-18 2019-10-24 Sony Interactive Entertainment Inc. Integrated understanding of user characteristics by multimodal processing
CN108520080A (zh) * 2018-05-11 2018-09-11 武汉理工大学 船舶柴油发电机故障预测与健康状态在线评估系统及方法
CN110503204A (zh) * 2018-05-17 2019-11-26 国际商业机器公司 识别用于机器学习任务的迁移模型
CN109816095A (zh) * 2019-01-14 2019-05-28 湖南大学 基于改进门控循环神经网络的网络流量预测方法
CN109492838A (zh) * 2019-01-16 2019-03-19 中国地质大学(武汉) 一种基于深度循环神经网络的股指价格预测方法
CN111489803A (zh) * 2020-03-31 2020-08-04 重庆金域医学检验所有限公司 基于自回归模型的报告单编码模型生成方法、系统和设备
CN112102135A (zh) * 2020-09-10 2020-12-18 重庆商务职业学院 基于lstm神经网络的高校贫困生精准资助模型
CN112561165A (zh) * 2020-12-16 2021-03-26 南京航空航天大学 一种基于组合模型的多维时序数据预测方法
CN113076235A (zh) * 2021-04-09 2021-07-06 中山大学 一种基于状态融合的时序异常检测方法
CN112835770A (zh) * 2021-04-22 2021-05-25 南京铉盈网络科技有限公司 基于稠密神经网络模型的法院自助阅卷终端工况评估方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DONATI, L等: "Prediction of Decline in Activities of Daily Living Through Deep Artificial Neural Networks and Domain Adaptation", 《LECTURE NOTES IN ARTIFICIAL INTELLIGENCE》, no. 11946, 31 December 2019 (2019-12-31), pages 376 - 391 *
杨甲甲: "采用长短期记忆深度学习模型的工业负荷短期预测方法", 《电力建设》, no. 10, 31 October 2018 (2018-10-31), pages 20 - 27 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117407754A (zh) * 2023-10-27 2024-01-16 北京中科闻歌科技股份有限公司 一种多模态大模型训练策略确定方法、电子设备及介质
CN117407754B (zh) * 2023-10-27 2024-04-19 北京中科闻歌科技股份有限公司 一种多模态大模型训练策略确定方法、电子设备及介质

Similar Documents

Publication Publication Date Title
CN106168799B (zh) 一种基于大数据机器学习进行电动汽车电池预测性维护的方法
CN105096053B (zh) 一种适用于复杂工艺系统的健康管理决策方法
CN111709244B (zh) 一种用于矛盾纠纷事件因果关系识别的深度学习方法
Yang et al. A novel method for maintenance record clustering and its application to a case study of maintenance optimization
CN102522709B (zh) 变压器状态检修的决策方法及系统
Abbasghorbani et al. Reliability‐centred maintenance for circuit breakers in transmission networks
CN111767398A (zh) 基于卷积神经网络的二次设备故障短文本数据分类方法
CN103077428B (zh) 一种厂级多台发电机组可靠性在线预测方法
CN106447201A (zh) 基于马尔可夫决策过程的输变电设备最佳检修决策方法
CN109740772A (zh) 基于大数据的铁路列车检测维修分析方法
CN111126437A (zh) 基于加权动态网络表示学习的异常群体检测方法
CN113706291A (zh) 欺诈风险预测方法、装置、设备及存储介质
CN113554077A (zh) 基于多模态神经网络模型的工况评估及业务量预测方法
CN112835770B (zh) 基于稠密神经网络模型的法院自助阅卷终端工况评估方法
CN107402859A (zh) 软件功能验证系统及其验证方法
AU2021102006A4 (en) A system and method for identifying online rumors based on propagation influence
CN113891342B (zh) 基站巡检方法、装置、电子设备及存储介质
CN114037138A (zh) 基于双层分解和深度学习的地铁短时进站客流预测系统及实施方法
CN108761263A (zh) 一种基于证据理论的故障诊断系统
CN105719042A (zh) 机台维护排程的方法与系统
CN116739408A (zh) 基于数据标签的电网调度安全监控方法、系统及电子设备
CN115713027A (zh) 一种变压器状态评估方法、装置及系统
CN116910341A (zh) 标签预测方法、装置及电子设备
CN110069838A (zh) 一种电子产品可靠性水平预计方法
CN116032726A (zh) 故障根因定位模型训练方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination