CN113887933A - 基于人工智能的数据处理方法、装置、设备及存储介质 - Google Patents

基于人工智能的数据处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113887933A
CN113887933A CN202111152130.3A CN202111152130A CN113887933A CN 113887933 A CN113887933 A CN 113887933A CN 202111152130 A CN202111152130 A CN 202111152130A CN 113887933 A CN113887933 A CN 113887933A
Authority
CN
China
Prior art keywords
auditing
audited
time period
determining
legal document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111152130.3A
Other languages
English (en)
Inventor
申李杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An International Smart City Technology Co Ltd
Original Assignee
Ping An International Smart City Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An International Smart City Technology Co Ltd filed Critical Ping An International Smart City Technology Co Ltd
Priority to CN202111152130.3A priority Critical patent/CN113887933A/zh
Publication of CN113887933A publication Critical patent/CN113887933A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0633Workflow analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/109Time management, e.g. calendars, reminders, meetings or time accounting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Primary Health Care (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Technology Law (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Artificial Intelligence (AREA)
  • Game Theory and Decision Science (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及人工智能领域,提供了一种基于人工智能的数据处理方法、装置、设备及存储介质,该方法包括:根据法官审核法律文件的行为数据生成样本数据;将样本数据存储至分布式文件系统中的对应存储区域内;根据存储区域内的全部样本数据,对神经网络模型进行迭代训练;根据文件审核用时预估模型和待审核法律文件的文件特征信息确定审核用时预估值;根据工作计划表和审核用时预估值,确定目标审核时间段;根据目标审核时间段确定审核提醒时刻,并在达到审核提醒时刻时,输出审核提醒信息。本申请提高了法官审核法律文件的便利性。本申请还涉及区块链领域,上述计算机可读存储介质可存储根据区块链节点的使用所创建的数据。

Description

基于人工智能的数据处理方法、装置、设备及存储介质
技术领域
本申请涉及人工智能领域,尤其涉及一种基于人工智能的数据处理方法、装置、设备及存储介质。
背景技术
随着互联网技术的快速发展,越来越多的公司或政府机构依托互联网技术实现业务或政务。在司法领域,人民法院依托互联网技术开通了线上诉讼服务渠道,方便用户通过手机、电脑等终端设备提交立案申请材料、提交证据材料、提交事项申请材料、签收文书送达、与法官进行沟通等操作。但同时,伴随着线上案件量的井喷式爆发,法官也面临着工作方式转变、业务处理压力增大等问题,由于线上审核操作繁琐、智能化辅助手段缺失、法官工作任务过于繁忙等问题,往往容易造成案件积压,导致案件超过处理时效,不便于法官审核。
发明内容
本申请实施例提供一种基于人工智能的数据处理方法、装置、设备及存储介质,旨在提高法官审核法律文件的便利性。
第一方面,本申请实施例提供一种数据处理方法,包括:
获取法官审核法律文件的行为数据,并根据所述行为数据生成样本数据;
从所述行为数据中获取法官身份标识,并将所述样本数据存储至分布式文件系统中的与所述法官身份标识对应的存储区域内;
在所述样本数据的个数大于或等于预设个数阈值时,根据所述存储区域内的全部样本数据,对预设的机器学习模型进行迭代训练,得到所述法官身份标识对应的文件审核用时预估模型;
根据所述文件审核用时预估模型和所述法官身份标识对应的待审核法律文件的文件特征信息,确定所述待审核法律文件的审核用时预估值;
获取所述法官身份标识对应的工作计划表,并根据所述工作计划表和所述审核用时预估值,确定所述待审核法律文件的目标审核时间段;
根据所述目标审核时间段确定所述待审核法律文件的审核提醒时刻,并在当前系统时刻达到所述审核提醒时刻时,输出审核提醒信息。
第二方面,本申请实施例还提供一种数据处理装置,所述数据处理装置包括:
获取模块,用于获取法官审核法律文件的行为数据;
样本生成模块,用于根据所述行为数据生成样本数据;
发送模块,用于从所述行为数据中获取法官身份标识,并将所述样本数据存储至分布式文件系统中的与所述法官身份标识对应的存储区域内;
模型训练模块,用于在所述样本数据的个数大于或等于预设个数阈值时,根据所述存储区域内的全部样本数据,对预设的机器学习模型进行迭代训练,得到所述法官身份标识对应的文件审核用时预估模型;
确定模块,用于根据所述文件审核用时预估模型和所述法官身份标识对应的待审核法律文件的文件特征信息,确定所述待审核法律文件的审核用时预估值;
所述确定模块,还用于获取所述法官身份标识对应的工作计划表,并根据所述工作计划表和所述审核用时预估值,确定所述待审核法律文件的目标审核时间段;
所述确定模块,还用于根据所述目标审核时间段确定所述待审核法律文件的审核提醒时刻;
输出模块,用于在当前系统时刻达到所述审核提醒时刻时,输出审核提醒信息。
第三方面,本申请实施例还提供一种服务器,所述服务器包括处理器和存储器;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如上所述的基于人工智能的数据处理方法的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上所述的基于人工智能的数据处理方法的步骤。
本申请实施例提供一种基于人工智能的数据处理方法、装置、设备及存储介质,该方法通过获取法官审核法律文件的行为数据,并根据该行为数据生成样本数据,且将样本数据存储至分布式文件系统中的与法官身份标识对应的存储区域内,然后在存储区域内的样本数据的个数达到预设个数阈值时,根据存储区域内的全部样本数据,对预设的机器学习模型进行迭代训练,得到法官身份标识对应的文件审核用时预估模型,并根据文件审核用时预估模型和法官身份标识对应的待审核法律文件的文件特征信息,确定待审核法律文件的审核用时预估值,最后根据法官身份标识对应的工作计划表和审核用时预估值,确定待审核法律文件的目标审核时间段,并根据目标审核时间段确定待审核法律文件的审核提醒时刻,且在当前系统时刻达到审核提醒时刻时,输出审核提醒信息,可以智能地辅助法官审核法律文件,提高法官审核法律文件的便利性和效率。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是实施本申请实施例提供的基于人工智能的数据处理方法的一场景示意图;
图2是本申请实施例提供的一种基于人工智能的数据处理方法的流程示意图;
图3是图2中的数据处理方法的子步骤流程示意图;
图4是本申请实施例提供的一种数据处理装置的示意性框图;
图5是图4中的数据处理装置的子模块的示意性框图;
图6是本申请实施例提供的一种计算机设备的结构示意性框图。
本申请目的的实现、功能特点及优点将结合实施例,参阅附图做进一步说明。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
随着互联网技术的快速发展,越来越多的公司或政府机构依托互联网技术实现业务或政务。在司法领域,人民法院依托互联网技术开通了线上诉讼服务渠道,方便用户通过手机、电脑等终端设备提交立案申请材料、提交证据材料、提交事项申请材料、签收文书送达、与法官进行沟通等操作。但同时,伴随着线上案件量的井喷式爆发,法官也面临着工作方式转变、业务处理压力增大等问题,由于线上审核操作繁琐、智能化辅助手段缺失、法官工作任务过于繁忙等问题,往往容易造成案件积压,导致案件超过处理时效,不便于法官审核。
为解决上述问题,本申请实施例提供一种基于人工智能的数据处理方法、装置、设备及存储介质。该方法通过获取法官审核法律文件的行为数据,并根据该行为数据生成样本数据,且将样本数据存储至分布式文件系统中的与法官身份标识对应的存储区域内,然后在存储区域内的样本数据的个数达到预设个数阈值时,根据存储区域内的全部样本数据,对预设的机器学习模型进行迭代训练,得到法官身份标识对应的文件审核用时预估模型,并根据文件审核用时预估模型和法官身份标识对应的待审核法律文件的文件特征信息,确定待审核法律文件的审核用时预估值,最后根据法官身份标识对应的工作计划表和审核用时预估值,确定待审核法律文件的目标审核时间段,并根据目标审核时间段确定待审核法律文件的审核提醒时刻,且在当前系统时刻达到审核提醒时刻时,输出审核提醒信息,可以智能地辅助法官审核法律文件,提高法官审核法律文件的便利性和效率。
其中,本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请实施例提供一种基于人工智能的数据处理方法可以应用于终端设备或服务器,该终端设备可以是手机、平板电脑、笔记本电脑和个人计算机等,该服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参阅图1,图1是实施本申请实施例提供的基于人工智能的数据处理方法的一场景示意图。如图1所示,该场景包括终端设备100、服务器200和分布式文件系统300,终端设备100与服务器200通信连接,服务器200与分布式文件系统300通信连接。其中,终端设备100可以包括手机、平板电脑、笔记本电脑、台式电脑等,分布式文件系统300可以包括:GlusterFS文件系统、CephFS文件系统、HDFS(Hadoop Distributed File System)、MooseFS文件系统。
其中,终端设备100采集法官审核法律文件的行为数据,并将行为数据发送给服务器200;服务器200获取终端设备100发送的法官审核法律文件的行为数据,并根据行为数据生成样本数据,从行为数据中获取法官身份标识,且将样本数据发送给分布式文件系统300;分布式文件系统300将样本数据存储在与法官身份标识对应的存储区域内。
在样本数据的个数大于或等于预设个数阈值时,服务器200根据存储区域内的全部样本数据,对预设的机器学习模型进行迭代训练,得到法官身份标识对应的文件审核用时预估模型;服务器200根据文件审核用时预估模型和所述法官身份标识对应的待审核法律文件的文件特征信息,确定待审核法律文件的审核用时预估值;服务器200获取法官身份标识对应的工作计划表,并根据工作计划表和审核用时预估值,确定待审核法律文件的目标审核时间段;根据目标审核时间段确定待审核法律文件的审核提醒时刻,并在当前系统时刻达到审核提醒时刻时,输出审核提醒信息。
请参阅图2,图2是本申请实施例提供的一种基于人工智能的数据处理方法的流程示意图。
如图2所示,该数据处理方法包括步骤S101至步骤S106。
步骤S101、获取法官审核法律文件的行为数据,并根据行为数据生成样本数据。
示例性的,法律文件可以包括起诉状、反诉状、答辩状、上诉状、强制执行申请书、财产保全申请书、先予执行申请书、回避申请书、宣告失踪申请书、宣告死亡申请书、支付令申请书、再审申诉书、行政复议申请书、行政诉讼起诉书、行政诉讼答辩书、行政强制执行申请书、行政上诉书、行政再审申诉书、离婚协议书、控告状、刑事自诉状、取保候审申请书、证据文件等。行为数据包括法律文件的文件类型、审核用时(法官审核法律文件所用的时长)、文件特征信息。
示例性的,根据行为数据生成样本数据的方式可以为:从行为数据中获取已审核法律文件的审核用时和文件特征信息;将已审核法律文件的审核用时和文件特征信息作为一条样本数据。其中,文件特征信息包括法律文件的案件类型、案由信息、文件类型、附件数量和文件大小。
步骤S102、从行为数据中获取法官身份标识,并将样本数据存储至分布式文件系统中的与法官身份标识对应的存储区域内。
其中,在法官注册账号时,服务器会在分布式文件系统中给每个法官账号分配存储区域,并将分配的存储区域与法官身份标识进行绑定,法官身份标识可以是法官的身份证号码、法官的手机号码,也可以是随机生成的多个位数的包括数字和/或字母的字符串,本实施例对此不做具体限定。
例如,在分布式文件系统中给法官甲和法官乙分配的存储区域分别为存储区域A和存储区域B,则在获取到法官甲审核法律文件的行为数据时,从该行为数据中获取法官甲的已审核法律文件的审核用时和文件特征信息,将审核用时和文件特征信息作为一条样本数据存储在存储区域A内。在获取到法官乙审核法律文件的行为数据时,从该行为数据中获取法官乙的已审核法律文件的审核用时和文件特征信息,将审核用时和文件特征信息作为一条样本数据存储在存储区域B内。
步骤S103、在样本数据的个数大于或等于预设个数阈值时,根据存储区域内的全部样本数据,对预设的机器学习模型进行迭代训练,得到法官身份标识对应的文件审核用时预估模型。
例如,在存储区域A内的样本数据的个数达到1000时,根据存储区域A内的全部样本数据,对预设的机器学习模型进行迭代训练,得到法官甲的文件审核用时预估模型。又例如,在存储区域B内的样本数据的个数达到1000时,根据存储区域B内的全部样本数据,对预设的机器学习模型进行迭代训练,得到法官乙的文件审核用时预估模型。其中,预设的机器学习模型可以包括随机森林树模型、决策树模型、神经网络模型等。
在一实施例中,在有多个存储区域内的样本数据的个数大于或等于预设个数阈值时,可以并列地根据各存储区域内的全部样本数据,分别对预设的神经网络模型进行迭代训练,得到各自对应的文件审核用时预估模型。例如,在存储区域A和存储区域B内的样本数据的个数均达到1000时,根据存储区域A内的全部样本数据,对预设的神经网络模型进行迭代训练,得到法官甲的文件审核用时预估模型,同时根据存储区域B内的全部样本数据,对预设的神经网络模型进行迭代训练,得到法官乙的文件审核用时预估模型。
示例性的,在样本数据的个数大于或等于预设个数阈值时,从存储区域中选择一条样本数据作为目标样本数据;将目标样本数据中的文件特征信息输入预设的神经网络模型,得到预测审核用时;利用预设损失函数,对预测审核用时和目标样本数据中的真实审核用时进行损失值计算,得到模型损失值;在模型损失值大于或等于预设损失值时,更新神经网络模型的参数;执行从存储区域中选择一条训练样本数据作为目标样本数据的步骤,直至模型损失值小于预设损失值。其中,预设个数阈值、预设损失函数、预设损失值可基于实际情况进行设置,本实施例对此不做具体限定。预设损失函数可以为均方误差函数,预设个数阈值为1000。
步骤S104、根据文件审核用时预估模型和法官身份标识对应的待审核法律文件的文件特征信息,确定待审核法律文件的审核用时预估值。
示例性的,以间隔预设时间获取法官身份标识对应的待审核法律文件,并获取待审核法律文件的文件特征信息。其中,预设时间可基于实际情况进行设置,本实施例对此不做具体限定。例如,预设时间为5分钟。
示例性的,获取法官身份标识对应的法律文件的审核标识,其中,审核标识包括第一标识和/或第二标识,第一标识表示法律文件处于未审核状态,第二标识表示法律文件处于已审核状态;将审核标识为第一标识的法律文件确定为法官身份标识对应的待审核法律文件。示例性的,获取法官身份标识对应的法律文件的剩余处理时长;将剩余处理时长最短的法律文件确定为待审核法律文件。其中,剩余处理时长是指法律文件的处理截止时间与当前系统时间之间的时长。
其中,待审核法律文件的文件特征信息包括待审核法律文件的案件类型、案由信息、文件类型、附件数量和文件大小。将待审核法律文件的文件特征信息输入审核用时预估模型,得到待审核法律文件的审核用时预估值。
步骤S105、获取法官身份标识对应的工作计划表,并根据工作计划表和审核用时预估值,确定待审核法律文件的目标审核时间段。
其中,服务器中存储有法官的工作计划表,工作计划表记录有法官的工作安排信息,工作安排信息包括各待处理事项的处理时间段。例如,开庭的时间段、会议的时间段、合议的时间段等。
在一实施例中,参阅图3,步骤S105包括:子步骤S1051至子步骤S1052。
子步骤S1051,根据法官身份标识对应的工作计划表确定至少一个空闲时间段。
例如,工作计划表记录的信息包括9:00-11:00开庭审、11:20-12:00参与会议、12:00-12:40吃午饭、13:30-15:50参与会议、16:10-18:20参与会议,19:00下班,因此,空闲时间段包括12:40-13:30、15:50-16:10、18:20-18:50。
子步骤S1052、根据待审核法律文件的审核用时预估值,从至少一个空闲时间段中确定待审核法律文件的目标审核时间段。
示例性的,确定各空闲时间段的时长,并将该时长大于或等于审核用时预估值的空闲时间段确定为候选时间段;确定待审核法律文件的文件类型和案件类型;根据文件类型和案件类型,确定待审核法律文件的历史审核时间段;将与历史审核时间段匹配的候选时间段确定为待审核法律文件的目标审核时间段。其中,在候选审核时间段与历史审核时间段部分重叠时,确定候选审核时间段与历史审核时间段匹配。
示例性的,根据文件类型和案件类型,确定待审核法律文件的历史审核时间段的方式可以为:根据法官身份标识,获取文件类型、案件类型与审核时间段之间的映射关系表;从映射关系表中选择与文件类型和案件类型对应的审核时间段作为待审核法律文件的历史审核时间段。其中,文件类型、案件类型与审核时间段之间的映射关系表是根据法官身份标识对应的行为数据生成的。
例如,待审核法律文件的审核用时预估值为10分钟,法官的空闲时间段12:40-13:30、15:50-16:05和18:30-18:50的时间长度分别为50分钟、15分钟和20分钟,因此,可以将空闲时间段12:40-13:30、15:50-16:05或18:30-18:50确定为待审核法律文件的目标审核时间段。
又例如,待审核法律文件的审核用时预估值为10分钟,将空闲时间段12:40-13:30、15:50-16:05或18:30-18:50确定为待审核法律文件的候选审核时间段,且待审核法律文件的历史审核时间段为15:55-16:05,通过比较发现,候选审核时间段15:50-16:05与历史审核时间段15:55-16:05相匹配,因此,将空闲时间段15:50-16:05确定为待审核法律文件的目标审核时间段。
步骤S106、根据目标审核时间段确定待审核法律文件的审核提醒时刻,并在当前系统时刻达到所述审核提醒时刻时,输出审核提醒信息。
示例性的,获取目标审核时间段的起始端点时刻,并将该起始端点时刻确定为待审核法律文件的审核提醒时刻。或者,获取目标审核时间段的起始端点时刻,并将起始端点时刻减去预设时长,得到待审核法律文件的审核提醒时刻。或者,获取目标审核时间段的起始端点时刻,并将起始端点时刻加上预设时长,得到待审核法律文件的审核提醒时刻。例如,目标审核时间段为15:50-16:05,则可以将起始端点时刻15:50确定为待审核法律文件的审核提醒时刻。又例如,目标审核时间段为15:50-16:05,且预设时长为1分钟,可以将时刻15:49或15:51确定为待审核法律文件的审核提醒时刻。
示例性的,输出审核提醒信息的方式可以为:确定待审核法律文件所属的法官账号,在当前系统时刻达到审核提醒时刻时,向该法官账号推送待审核法律文件的审核提醒信息,或者以短信的方向,向与法官账号绑定的手机号码发送待审核法律文件的审核提醒信息,或者向与法官账号绑定的手机号码发起通话请求,在建立通话后,发送审核提醒信息。
上述实施例提供的数据处理方法,通过获取法官审核法律文件的行为数据,并根据该行为数据生成样本数据,且将样本数据存储至分布式文件系统中的与法官身份标识对应的存储区域内,然后在存储区域内的样本数据的个数达到预设个数阈值时,根据存储区域内的全部样本数据,对预设的机器学习模型进行迭代训练,得到法官身份标识对应的文件审核用时预估模型,并根据文件审核用时预估模型和法官身份标识对应的待审核法律文件的文件特征信息,确定待审核法律文件的审核用时预估值,最后根据法官身份标识对应的工作计划表和审核用时预估值,确定待审核法律文件的目标审核时间段,并根据目标审核时间段确定待审核法律文件的审核提醒时刻,且在当前系统时刻达到审核提醒时刻时,输出审核提醒信息,可以智能地辅助法官审核法律文件,提高法官审核法律文件的便利性和效率。
请参阅图4,图4是本申请实施例提供的一种数据处理装置的示意性框图。
如图4所示,该数据处理装置400,包括:
获取模块410,用于获取法官审核法律文件的行为数据;
样本生成模块420,用于根据所述行为数据生成样本数据;
发送模块430,用于从所述行为数据中获取法官身份标识,并将所述样本数据存储至分布式文件系统中的与所述法官身份标识对应的存储区域内;
模型训练模块440,用于在所述样本数据的个数大于或等于预设个数阈值时,根据所述存储区域内的全部样本数据,对预设的机器学习模型进行迭代训练,得到所述法官身份标识对应的文件审核用时预估模型;
确定模块450,用于根据所述文件审核用时预估模型和所述法官身份标识对应的待审核法律文件的文件特征信息,确定所述待审核法律文件的审核用时预估值;
所述确定模块450,还用于获取所述法官身份标识对应的工作计划表,并根据所述工作计划表和所述审核用时预估值,确定所述待审核法律文件的目标审核时间段;
所述确定模块450,还用于根据所述目标审核时间段确定所述待审核法律文件的审核提醒时刻;
输出模块460,用于在当前系统时刻达到所述审核提醒时刻时,输出审核提醒信息。
在一实施例中,所述样本生成模块420还用于:
从所述行为数据中获取已审核法律文件的审核用时和文件特征信息;
将所述已审核法律文件的审核用时和文件特征信息作为一条样本数据。
在一实施例中,所述模型训练模块440还用于:
从所述存储区域中选择一条样本数据作为目标样本数据;
将所述目标样本数据中的文件特征信息输入预设的机器学习模型,得到预测审核用时;
利用预设损失函数,对所述预测审核用时和所述目标样本数据中的真实审核用时进行损失值计算,得到模型损失值;
在所述模型损失值大于或等于预设损失值时,更新所述神经网络模型的参数;
执行从所述存储区域中选择一条训练样本数据作为目标样本数据的步骤,直至所述模型损失值小于预设损失值。
在一实施例中,如图5所示,所述确定模块450包括:
第一确定子模块451,用于根据所述法官身份标识对应的工作计划表确定至少一个空闲时间段;
第二确定子模块452,用于根据所述待审核法律文件的审核用时预估值,从至少一个所述空闲时间段中确定所述待审核法律文件的目标审核时间段。
在一实施例中,第二确定子模块452还用于:
确定各所述空闲时间段的时长,并将所述时长大于或等于所述审核用时预估值的空闲时间段确定为候选时间段;
确定所述待审核法律文件的文件类型和案件类型;
根据所述文件类型和案件类型,确定所述待审核法律文件的历史审核时间段;
将与所述历史审核时间段匹配的所述候选时间段确定为待审核法律文件的目标审核时间段。
在一实施例中,第二确定子模块452还用于:
根据所述法官身份标识,获取文件类型、案件类型与审核时间段之间的映射关系表;
从所述映射关系表中选择与所述文件类型和案件类型对应的审核时间段作为所述待审核法律文件的历史审核时间段。
在一实施例中,所述确定模块450还用于:
获取所述目标审核时间段的起始端点时刻;
将所述起始端点时刻减去预设时长,得到所述待审核法律文件的审核提醒时刻。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块及单元的具体工作过程,可以参考前述数据处理方法实施例中的对应过程,在此不再赘述。
上述实施例提供的装置可以实现为一种计算机程序的形式,该计算机程序可以在如图6所示的服务器上运行。
请参阅图6,图6是本申请实施例提供的一种计算机设备的结构示意性框图。计算机设备可以为服务器或终端设备。
如图6所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括存储介质和内存储器。
存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种基于人工智能的数据处理方法。
处理器用于提供计算和控制能力,支撑整个服务器的运行。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
获取法官审核法律文件的行为数据,并根据所述行为数据生成样本数据;
从所述行为数据中获取法官身份标识,并将所述样本数据存储至分布式文件系统中的与所述法官身份标识对应的存储区域内;
在所述样本数据的个数大于或等于预设个数阈值时,根据所述存储区域内的全部样本数据,对预设的机器学习模型进行迭代训练,得到所述法官身份标识对应的文件审核用时预估模型;
根据所述文件审核用时预估模型和所述法官身份标识对应的待审核法律文件的文件特征信息,确定所述待审核法律文件的审核用时预估值;
获取所述法官身份标识对应的工作计划表,并根据所述工作计划表和所述审核用时预估值,确定所述待审核法律文件的目标审核时间段;
根据所述目标审核时间段确定所述待审核法律文件的审核提醒时刻,并在当前系统时刻达到所述审核提醒时刻时,输出审核提醒信息。
在一实施例中,所述处理器在实现根据所述行为数据生成样本数据时,用于实现:
从所述行为数据中获取已审核法律文件的审核用时和文件特征信息;
将所述已审核法律文件的审核用时和文件特征信息作为一条样本数据。
在一实施例中,所述处理器在实现根据所述存储区域内的全部样本数据,对预设的机器学习模型进行迭代训练时,用于实现:
从所述存储区域中选择一条样本数据作为目标样本数据;
将所述目标样本数据中的文件特征信息输入预设的机器学习模型,得到预测审核用时;
利用预设损失函数,对所述预测审核用时和所述目标样本数据中的真实审核用时进行损失值计算,得到模型损失值;
在所述模型损失值大于或等于预设损失值时,更新所述神经网络模型的参数;
执行从所述存储区域中选择一条训练样本数据作为目标样本数据的步骤,直至所述模型损失值小于预设损失值。
在一实施例中,所述处理器在实现根据所述工作计划表和所述审核用时预估值,确定所述待审核法律文件的目标审核时间段时,用于实现:
根据所述法官身份标识对应的工作计划表确定至少一个空闲时间段;
根据所述待审核法律文件的审核用时预估值,从至少一个所述空闲时间段中确定所述待审核法律文件的目标审核时间段。
在一实施例中,所述处理器在实现根据所述待审核法律文件的审核用时预估值,从至少一个所述空闲时间段中确定所述待审核法律文件的目标审核时间段时,用于实现:
确定各所述空闲时间段的时长,并将所述时长大于或等于所述审核用时预估值的空闲时间段确定为候选时间段;
确定所述待审核法律文件的文件类型和案件类型;
根据所述文件类型和案件类型,确定所述待审核法律文件的历史审核时间段;
将与所述历史审核时间段匹配的所述候选时间段确定为待审核法律文件的目标审核时间段。
在一实施例中,所述处理器在实现根据所述文件类型和案件类型,确定所述待审核法律文件的历史审核时间段时,用于实现:
根据所述法官身份标识,获取文件类型、案件类型与审核时间段之间的映射关系表;
从所述映射关系表中选择与所述文件类型和案件类型对应的审核时间段作为所述待审核法律文件的历史审核时间段。
在一实施例中,所述处理器在实现根据所述目标审核时间段确定所述待审核法律文件的审核提醒时刻时,用于实现:
获取所述目标审核时间段的起始端点时刻;
将所述起始端点时刻减去预设时长,得到所述待审核法律文件的审核提醒时刻。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的计算机设备的具体工作过程,可以参考前述数据处理方法实施例中的对应过程,在此不再赘述。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备执行本申请各个实施例或者实施例的某些部分所述的方法。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序中包括程序指令,所述程序指令被执行时所实现的方法可参阅本申请数据处理方法的各个实施例。
其中,所述计算机可读存储介质可以是易失性的,也可以是非易失性的。所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种基于人工智能的数据处理方法,其特征在于,包括:
获取法官审核法律文件的行为数据,并根据所述行为数据生成样本数据;
从所述行为数据中获取法官身份标识,并将所述样本数据存储至分布式文件系统中的与所述法官身份标识对应的存储区域内;
在所述样本数据的个数大于或等于预设个数阈值时,根据所述存储区域内的全部样本数据,对预设的机器学习模型进行迭代训练,得到所述法官身份标识对应的文件审核用时预估模型;
根据所述文件审核用时预估模型和所述法官身份标识对应的待审核法律文件的文件特征信息,确定所述待审核法律文件的审核用时预估值;
获取所述法官身份标识对应的工作计划表,并根据所述工作计划表和所述审核用时预估值,确定所述待审核法律文件的目标审核时间段;
根据所述目标审核时间段确定所述待审核法律文件的审核提醒时刻,并在当前系统时刻达到所述审核提醒时刻时,输出审核提醒信息。
2.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述行为数据生成样本数据,包括:
从所述行为数据中获取已审核法律文件的审核用时和文件特征信息;
将所述已审核法律文件的审核用时和文件特征信息作为一条样本数据。
3.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述存储区域内的全部样本数据,对预设的机器学习模型进行迭代训练,包括:
从所述存储区域中选择一条样本数据作为目标样本数据;
将所述目标样本数据中的文件特征信息输入预设的机器学习模型,得到预测审核用时;
利用预设损失函数,对所述预测审核用时和所述目标样本数据中的真实审核用时进行损失值计算,得到模型损失值;
在所述模型损失值大于或等于预设损失值时,更新所述神经网络模型的参数;
执行从所述存储区域中选择一条训练样本数据作为目标样本数据的步骤,直至所述模型损失值小于预设损失值。
4.根据权利要求1-3中任一项所述的数据处理方法,其特征在于,所述根据所述工作计划表和所述审核用时预估值,确定所述待审核法律文件的目标审核时间段,包括:
根据所述法官身份标识对应的工作计划表确定至少一个空闲时间段;
根据所述待审核法律文件的审核用时预估值,从至少一个所述空闲时间段中确定所述待审核法律文件的目标审核时间段。
5.根据权利要求4所述的数据处理方法,其特征在于,所述根据所述待审核法律文件的审核用时预估值,从至少一个所述空闲时间段中确定所述待审核法律文件的目标审核时间段,包括:
确定各所述空闲时间段的时长,并将所述时长大于或等于所述审核用时预估值的空闲时间段确定为候选时间段;
确定所述待审核法律文件的文件类型和案件类型;
根据所述文件类型和案件类型,确定所述待审核法律文件的历史审核时间段;
将与所述历史审核时间段匹配的所述候选时间段确定为待审核法律文件的目标审核时间段。
6.根据权利要求5所述的数据处理方法,其特征在于,所述根据所述文件类型和案件类型,确定所述待审核法律文件的历史审核时间段,包括:
根据所述法官身份标识,获取文件类型、案件类型与审核时间段之间的映射关系表;
从所述映射关系表中选择与所述文件类型和案件类型对应的审核时间段作为所述待审核法律文件的历史审核时间段。
7.根据权利要求1-3中任一项所述的数据处理方法,其特征在于,所述根据所述目标审核时间段确定所述待审核法律文件的审核提醒时刻,包括:
获取所述目标审核时间段的起始端点时刻;
将所述起始端点时刻减去预设时长,得到所述待审核法律文件的审核提醒时刻。
8.一种数据处理装置,其特征在于,所述数据处理装置包括:
获取模块,用于获取法官审核法律文件的行为数据;
样本生成模块,用于根据所述行为数据生成样本数据;
发送模块,用于从所述行为数据中获取法官身份标识,并将所述样本数据存储至分布式文件系统中的与所述法官身份标识对应的存储区域内;
模型训练模块,用于在所述样本数据的个数大于或等于预设个数阈值时,根据所述存储区域内的全部样本数据,对预设的机器学习模型进行迭代训练,得到所述法官身份标识对应的文件审核用时预估模型;
确定模块,用于根据所述文件审核用时预估模型和所述法官身份标识对应的待审核法律文件的文件特征信息,确定所述待审核法律文件的审核用时预估值;
所述确定模块,还用于获取所述法官身份标识对应的工作计划表,并根据所述工作计划表和所述审核用时预估值,确定所述待审核法律文件的目标审核时间段;
所述确定模块,还用于根据所述目标审核时间段确定所述待审核法律文件的审核提醒时刻;
输出模块,用于在当前系统时刻达到所述审核提醒时刻时,输出审核提醒信息。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如权利要求1至7中任一项所述的基于人工智能的数据处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如权利要求1至7中任一项所述的基于人工智能的数据处理方法的步骤。
CN202111152130.3A 2021-09-29 2021-09-29 基于人工智能的数据处理方法、装置、设备及存储介质 Pending CN113887933A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111152130.3A CN113887933A (zh) 2021-09-29 2021-09-29 基于人工智能的数据处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111152130.3A CN113887933A (zh) 2021-09-29 2021-09-29 基于人工智能的数据处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN113887933A true CN113887933A (zh) 2022-01-04

Family

ID=79008146

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111152130.3A Pending CN113887933A (zh) 2021-09-29 2021-09-29 基于人工智能的数据处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113887933A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114782030A (zh) * 2022-06-24 2022-07-22 硕广达微电子(深圳)有限公司 一种基于大数据项目智能管理系统及方法
CN115618844A (zh) * 2022-12-20 2023-01-17 江苏龙虎网信息科技股份有限公司 一种基于人工智能的内容审核系统及方法
CN117911179A (zh) * 2024-01-24 2024-04-19 中智薪税技术服务有限公司 一种财税数据审核方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150220649A1 (en) * 2014-02-04 2015-08-06 Shoobx, Inc. Computer-guided Corporate Governance with Document Generation and Execution
CN110175605A (zh) * 2019-05-27 2019-08-27 北京市律典通科技有限公司 基于要素式的电子审判数据处理方法及装置
CN110489524A (zh) * 2019-08-05 2019-11-22 北京市律典通科技有限公司 涉刑案件数据智能审查方法及装置
CN112269878A (zh) * 2020-11-02 2021-01-26 成都纬创立科技有限公司 可解释法律判决预测方法、装置、电子设备及存储介质
CN112418813A (zh) * 2020-12-02 2021-02-26 上海三稻智能科技有限公司 基于智能解析识别的aeo资质智能评级管理系统、方法及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150220649A1 (en) * 2014-02-04 2015-08-06 Shoobx, Inc. Computer-guided Corporate Governance with Document Generation and Execution
CN110175605A (zh) * 2019-05-27 2019-08-27 北京市律典通科技有限公司 基于要素式的电子审判数据处理方法及装置
CN110489524A (zh) * 2019-08-05 2019-11-22 北京市律典通科技有限公司 涉刑案件数据智能审查方法及装置
CN112269878A (zh) * 2020-11-02 2021-01-26 成都纬创立科技有限公司 可解释法律判决预测方法、装置、电子设备及存储介质
CN112418813A (zh) * 2020-12-02 2021-02-26 上海三稻智能科技有限公司 基于智能解析识别的aeo资质智能评级管理系统、方法及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114782030A (zh) * 2022-06-24 2022-07-22 硕广达微电子(深圳)有限公司 一种基于大数据项目智能管理系统及方法
CN115618844A (zh) * 2022-12-20 2023-01-17 江苏龙虎网信息科技股份有限公司 一种基于人工智能的内容审核系统及方法
CN117911179A (zh) * 2024-01-24 2024-04-19 中智薪税技术服务有限公司 一种财税数据审核方法及系统

Similar Documents

Publication Publication Date Title
CN113887933A (zh) 基于人工智能的数据处理方法、装置、设备及存储介质
CN110992167B (zh) 银行客户业务意图识别方法及装置
CN108428132B (zh) 欺诈交易识别方法、装置、服务器及存储介质
US20160117624A1 (en) Intelligent meeting enhancement system
CN112613917A (zh) 基于用户画像的信息推送方法、装置、设备及存储介质
CN110598070B (zh) 应用类型识别方法及装置、服务器及存储介质
CN110442697B (zh) 一种人机交互方法、系统、计算机设备和存储介质
CN113836228B (zh) 管理系统的构建方法、装置、管理系统、设备及存储介质
Kalia et al. Monitoring commitments in people-driven service engagements
Omri et al. Cloud-ready biometric system for mobile security access
CN111813946A (zh) 医疗信息反馈方法、装置、设备及可读存储介质
CN111124421B (zh) 区块链智能合约的异常合约数据检测方法和装置
Kuter et al. Semantic web service composition in social environments
CN117252362A (zh) 基于人工智能的调度方法、装置、计算机设备及存储介质
CN116525093A (zh) 会话结束的预测方法、装置、设备及存储介质
CN115114666A (zh) 一种基于区块链的考勤数据隐私计算方法和系统
CN114021664A (zh) 一种基于区块链的意图识别方法、装置及电子设备
CN114493850A (zh) 基于人工智能的在线公证方法、系统及存储介质
Osorio et al. Ontology-based Operational Risk Identification in 3PL.
Krouwel et al. Using enterprise ontology as a basis for requirements for cross-organizationally usable applications
CN118071310B (zh) 一种基于流程引擎的业务处理方法及系统
Agarwal Developing an Approach to Evaluate and Observe Sentiments of Tweets
CN115567646A (zh) 智能外呼方法、装置、计算机设备及存储介质
CN116402290A (zh) 基于决策树的任务排期方法、装置、设备及存储介质
CN113869776A (zh) 基于大数据的任务委派方法及其相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination