CN113034318A - 流域资源环境案件数据采集系统及设备 - Google Patents

流域资源环境案件数据采集系统及设备 Download PDF

Info

Publication number
CN113034318A
CN113034318A CN202110492352.3A CN202110492352A CN113034318A CN 113034318 A CN113034318 A CN 113034318A CN 202110492352 A CN202110492352 A CN 202110492352A CN 113034318 A CN113034318 A CN 113034318A
Authority
CN
China
Prior art keywords
resource environment
case
module
point
dispute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110492352.3A
Other languages
English (en)
Inventor
罗文君
邱秋
王腾
王秀才
郭砚君
严诗博
程威
张浩浩
王涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HUBEI UNIVERSITY OF ECONOMICS
Original Assignee
HUBEI UNIVERSITY OF ECONOMICS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HUBEI UNIVERSITY OF ECONOMICS filed Critical HUBEI UNIVERSITY OF ECONOMICS
Priority to CN202110492352.3A priority Critical patent/CN113034318A/zh
Publication of CN113034318A publication Critical patent/CN113034318A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Technology Law (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种流域资源环境案件数据采集系统及设备。所述系统包括:案件关键词索引模块,案件确定模块,区域检索模块,文书类型抓取模块,案件类型抓取模块,案件重要程度抓取模块,审判法庭抓取模块,案由抓取模块,法院类型抓取模块,公益诉讼类型抓取模块,公益诉讼责任承担方式抓取模块,审判流程抓取模块,证据适用性抓取模块。本发明通过将多种功能模块进行系统集成,可以对流域资源环境案件进行准确收集,具有收集的流域资源环境案件泛化性好,收集过程快捷便利的特点,有效提高了流域资源环境案件的收集效率,降低了流域资源环境案件收集的经济成本。

Description

流域资源环境案件数据采集系统及设备
技术领域
本发明实施例涉及环境监测技术领域,尤其涉及一种流域资源环境案件数据采集系统及设备。
背景技术
目前,可持续发展已经成为关乎国计民生的大事,而流域资源环境的保护更是成为了环保项目的重中之重。生态环境与人类的生活息息相关,水资源是一种及其重要的生态环境资源,其污染案件近几年呈现高发状态。通过对水资源污染案件的收集和分析,可以更好的确定水资源的生态环境目前所处的状态,以及危害水资源环境的主要因素。但是,目前水资源污染案件的收集主要依赖人工进行,不仅费时费力,而且收集案件的全面性和准确性都无法得到保证。因此,开发一种流域资源环境案件数据采集系统及设备,可以有效克服上述相关技术中的缺陷,就成为业界亟待解决的技术问题。
发明内容
针对现有技术存在的上述问题,本发明实施例提供了一种流域资源环境案件数据采集系统及设备。
第一方面,本发明的实施例提供了一种流域资源环境案件数据采集系统,包括:案件关键词索引模块,用于根据案件关键词在网络上对已经公布的流域资源环境案件进行检索;案件确定模块,用于对检索到的流域资源环境案件进行识别,确定最终需要的流域资源环境案件;区域检索模块,用于对流域资源环境案件的检索区域进行限定;文书类型抓取模块,用于对审判的文书类型进行区别提取;案件类型抓取模块,用于对审判的案件类型进行区别提取;案件重要程度抓取模块,用于对案件的重要程度进行区别提取;审判法庭抓取模块,用于对审判法庭的种类进行区别提取;案由抓取模块,用于对案由种类进行区别提取;法院类型抓取模块,用于对法院种类进行区别提取;公益诉讼类型抓取模块,用于对公益诉讼的种类进行区别提取;公益诉讼责任承担方式抓取模块,用于对公益诉讼责任承担的种类进行提取;审判流程抓取模块,用于对审判流程的终止节点进行区别提取;证据适用性抓取模块,用于对证据的适用结果进行区别提取。
在上述系统实施例内容的基础上,本发明实施例中提供的流域资源环境案件数据采集系统,所述对检索到的流域资源环境案件进行识别,确定最终需要的流域资源环境案件,包括:从检索到的流域资源环境案件中提取对象文本,对所述对象文本进行滤波去噪,在去噪后的对象文本中锁定有效字符,并将有效字符区块化得到若干字符区块,对每个字符区块中的像素点的像素值进行二值化,并归一化每个二值化字符区块中的尺寸,得到若干第一字符区块,将每个第一字符区块中的直流分量调整为0,交流分量的平均功率调整为1,得到若干调整字符区块,将每个调整字符区块加载于底衬文本的中心位置,得到每个调整字符区块对应的版块图,将每个板块图输入到预先训练的卷积神经网络中进行识别,获得每个板块图的文字识别结果,根据所述文字识别结果确定最终需要的流域资源环境案件;其中,底衬文本中像素点的灰度值均为0。
在上述系统实施例内容的基础上,本发明实施例中提供的流域资源环境案件数据采集系统,所述对所述对象文本进行滤波去噪,包括:
Figure BDA0003052941690000021
其中,A为滤波去噪后对象文本中像素点的灰度值;Z为对象文本中像素点的数量;x为像素点的横坐标;y为像素点的纵坐标;W为像素点(x,y)领域点的坐标集合;C为对象文本中每个像素点的灰度值;m为领域点的横坐标;n为领域点的纵坐标。
在上述系统实施例内容的基础上,本发明实施例中提供的流域资源环境案件数据采集系统,所述并将有效字符区块化得到若干字符区块,包括:向有效字符区域上随机投射若干检测点,获取每个检测点对应的像素值,若对应的像素值中存在黑色像素点的像素值,则选取任一黑色像素点作为辐射起点向外进行黑点辐射检测,则全部经过黑点辐射检测到的黑色像素点就构成一有效字符区块。
在上述系统实施例内容的基础上,本发明实施例中提供的流域资源环境案件数据采集系统,所述则选取任一黑色像素点作为辐射起点向外进行黑点辐射检测,包括:以所述任一黑色像素点为中心在邻近方向上继续检测黑色像素点,将检测到的新黑色像素点作为新中心,在新中心的邻近方向上继续检测,直至检测不到新的黑色像素点;其中,所述邻近方向包括上方向、下方向、左方向、右方向、右上方向、右下方向、左上方向和左下方向。
在上述系统实施例内容的基础上,本发明实施例中提供的流域资源环境案件数据采集系统,在所述则全部经过黑点辐射检测到的黑色像素点就构成一有效字符区块之后,还包括:若对应的像素值中不存在黑色像素点的像素值,则继续向有效字符区域上随机投射若干检测点,直至检测点对应的像素值中存在黑色像素点的像素值,然后继续进行黑点辐射检测,直至得到另一有效字符区块。
在上述系统实施例内容的基础上,本发明实施例中提供的流域资源环境案件数据采集系统,所述案由种类包括:中外合作勘探开发自然资源合同纠纷、养殖权纠纷、取水权纠纷、捕捞权纠纷、水污染责任纠纷、污染环境罪、渔业承包合同纠纷、环境保护、环境污染责任纠纷、环境监管失职罪、船舶污染损害责任纠纷、重大环境污染事故罪、非法处置进口固体废物罪和非法捕捞水产品罪。
在上述系统实施例内容的基础上,本发明实施例中提供的流域资源环境案件数据采集系统,所述公益诉讼责任承担的种类包括:恢复原状、停止侵害、赔礼道歉、赔偿环境修复费、赔偿经济损失和消除危害。
第二方面,本发明的实施例提供了一种电子设备,包括:
至少一个处理器;以及
与处理器通信连接的至少一个存储器,其中:
存储器存储有可被处理器执行的程序指令,处理器调用程序指令能够执行第一方面的各种实现方式中任一种实现方式所提供的流域资源环境案件数据采集系统。
第三方面,本发明的实施例提供了一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机实现第一方面的各种实现方式中任一种实现方式所提供的流域资源环境案件数据采集系统。
本发明实施例提供的流域资源环境案件数据采集系统及设备,通过将多种功能模块进行系统集成,可以对流域资源环境案件进行准确收集,具有收集的流域资源环境案件泛化性好,收集过程快捷便利的特点,有效提高了流域资源环境案件的收集效率,降低了流域资源环境案件收集的经济成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做一简单的介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的流域资源环境案件数据采集系统结构示意图;
图2为本发明实施例提供的电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。另外,本发明提供的各个实施例或单个实施例中的技术特征可以相互任意结合,以形成可行的技术方案,这种结合不受步骤先后次序和/或结构组成模式的约束,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时,应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
本发明实施例提供了一种流域资源环境案件数据采集系统,参见图1,该系统包括:案件关键词索引模块,用于根据案件关键词在网络上对已经公布的流域资源环境案件进行检索;案件确定模块,用于对检索到的流域资源环境案件进行识别,确定最终需要的流域资源环境案件;区域检索模块,用于对流域资源环境案件的检索区域进行限定;文书类型抓取模块,用于对审判的文书类型进行区别提取;案件类型抓取模块,用于对审判的案件类型进行区别提取;案件重要程度抓取模块,用于对案件的重要程度进行区别提取;审判法庭抓取模块,用于对审判法庭的种类进行区别提取;案由抓取模块,用于对案由种类进行区别提取;法院类型抓取模块,用于对法院种类进行区别提取;公益诉讼类型抓取模块,用于对公益诉讼的种类进行区别提取;公益诉讼责任承担方式抓取模块,用于对公益诉讼责任承担的种类进行提取;审判流程抓取模块,用于对审判流程的终止节点进行区别提取;证据适用性抓取模块,用于对证据的适用结果进行区别提取。
具体地,流域资源环境案件的检索区域包括中国大陆的所有省、直辖市及自治区,例如:江苏省,河南省及四川省等省份。审判的文书类型包括判决书和裁定书。审判的案件类型包括刑事案件、民事案件及行政案件。案件的重要程度包括普通案件、经典案件、参阅案件及典型案件。审判法庭的种类包括环境资源庭、行政庭、民庭及刑庭。法院种类包括高级人民法院、中级人民法院及基层人民法院。公益诉讼的种类包括行政公益诉讼及行政公益诉讼。审判流程的终止节点包括一审结案、二审结案及再审结案。证据的适用结果包括证据全部予以采信、证据部分予以采信及证据不予采信。
基于上述系统实施例的内容,作为一种可选的实施例,本发明实施例中提供的流域资源环境案件数据采集系统,所述对检索到的流域资源环境案件进行识别,确定最终需要的流域资源环境案件,包括:从检索到的流域资源环境案件中提取对象文本,对所述对象文本进行滤波去噪,在去噪后的对象文本中锁定有效字符,并将有效字符区块化得到若干字符区块,对每个字符区块中的像素点的像素值进行二值化,并归一化每个二值化字符区块中的尺寸,得到若干第一字符区块,将每个第一字符区块中的直流分量调整为0,交流分量的平均功率调整为1,得到若干调整字符区块,将每个调整字符区块加载于底衬文本的中心位置,得到每个调整字符区块对应的版块图,将每个板块图输入到预先训练的卷积神经网络中进行识别,获得每个板块图的文字识别结果,根据所述文字识别结果确定最终需要的流域资源环境案件;其中,底衬文本中像素点的灰度值均为0。
具体地,检索到需要进行文字识别的对像文本后,通过滤波去噪剔除对象文本中的各种噪声,在去噪后的对象文本中锁定有效字符,根据锁定结果,将对象文本中的有效字符进行区块化,得到对象文本中的各个字符区块。对提取到的每个字符区块的像素点的像素值进行二值化,将背景像素点的灰度值置0,将字符像素点的灰度值置1。将所有字符区块的尺寸归一化,将归一化的字符区块中的直流分量调整为0,交流分量的平均功率调整为1,得到调整字符区块。将每个第一调整字符区块加载于底衬文本的中心位置,该底衬文本中像素点的灰度值均为0,从而可以获得每个字符区块对应的版块图。分别将每个版块图输入到预先训练的卷积神经网络中进行识别,获得每个版块图的文字识别结果。
卷积神经网络的训练如下所示:由于提取的文字的大小有所不同,所以卷积神经网络采用复合通道卷积神经网络,包括第一通道网络和第二通道网络。将版块图样本输入到第一通道网络中,同时对输入的版块图样本进行尺寸变换,得到第二通道网络的输入层图像。假设第一通道网络输入的版块图的分辨率大小为64×64,第二通道网络输入的版块图分辨率大小为32×32。
在第一通道网络上,对相应输入的版块图采用4×4大小卷积核进行卷积,加上偏移量,通过激活函数得到C1层。对C1层利用4×4大小卷积核进行卷积得到几个C2层特征图。其中C1层与C2层之间为随机连接。对C2层利用3×3模板进行池化,得到池化层S3。对S3层利用3×3大小卷积核进行卷积,加上偏移量,经过激活函数得到卷积层C4层,紧接着依次为池化层S5、卷积层C6、池化层S7。将池化层S7乘以参数矩阵,同时加上偏移量,通过激活函数得到全连接层F8。
在第二通道网络上,采用3×3大小的卷积核。对相应输入层图像进行卷积,加上偏移量,结果输入激活函数得到卷积层C11。对C11利用3×3模板进行池化,得到池化层S2。并依次得到卷积层C3、池化层S4、全连接层F5。将全连接层F8、F5连接,加上偏移量,结果输入激活函数得到全连接层F。卷积神经网络输出层采用Softmax函数得到输出向量,输出向量与目标向量存在一定误差,利用梯度下降法进行反向传播,调整网络参数。通过多次训练及测试,即可得到目标卷积神经网络。得到的目标卷积神经网络也为复合通道卷积神经网络。
分别将对象文本对应的每个版块图输入到复合通道卷积神经网络中,可以获得每个版块图的文字识别结果。
基于上述系统实施例的内容,作为一种可选的实施例,本发明实施例中提供的流域资源环境案件数据采集系统,所述对所述对象文本进行滤波去噪,包括:
Figure BDA0003052941690000061
其中,A为滤波去噪后对象文本中像素点的灰度值;Z为对象文本中像素点的数量;x为像素点的横坐标;y为像素点的纵坐标;W为像素点(x,y)领域点的坐标集合;C为对象文本中每个像素点的灰度值;m为领域点的横坐标;n为领域点的纵坐标。
具体地,滤波去噪的过程主要是采用低通滤波器将噪声对应的高频分量滤去,去除图像的毛刺点及锯齿点。像素点的区域中间值替换是指取得图像一区域内全部像素点灰度值的中间值,将图像一区域内每个像素点的灰度值替换为全部像素点灰度值的中间值。例如,图像中的每个像素点的灰度值为C(x,y),图像具有N*N个像素,进行像素点的区域中间值替换后得到图像的像素点的灰度值A(x,y),则如(1)式所示。经低通滤波器去噪后图像中像素的灰度值有包含在点(x,y)领域中的几个像素灰度的均值来确定。一般的噪声属于加性噪声,并且其均值为零,方差为σ2,故去噪后图像的信噪比将提高Z倍(Z为领域中像素点的个数,即对象文本中像素点的数量)。由此可见,区域的面积越大,像素点越多,图像信噪比越大。
基于上述系统实施例的内容,作为一种可选的实施例,本发明实施例中提供的流域资源环境案件数据采集系统,所述并将有效字符区块化得到若干字符区块,包括:向有效字符区域上随机投射若干检测点,获取每个检测点对应的像素值,若对应的像素值中存在黑色像素点的像素值,则选取任一黑色像素点作为辐射起点向外进行黑点辐射检测,则全部经过黑点辐射检测到的黑色像素点就构成一有效字符区块。
基于上述系统实施例的内容,作为一种可选的实施例,本发明实施例中提供的流域资源环境案件数据采集系统,所述则选取任一黑色像素点作为辐射起点向外进行黑点辐射检测,包括:以所述任一黑色像素点为中心在邻近方向上继续检测黑色像素点,将检测到的新黑色像素点作为新中心,在新中心的邻近方向上继续检测,直至检测不到新的黑色像素点;其中,所述邻近方向包括上方向、下方向、左方向、右方向、右上方向、右下方向、左上方向和左下方向。
基于上述系统实施例的内容,作为一种可选的实施例,本发明实施例中提供的流域资源环境案件数据采集系统,在所述则全部经过黑点辐射检测到的黑色像素点就构成一有效字符区块之后,还包括:若对应的像素值中不存在黑色像素点的像素值,则继续向有效字符区域上随机投射若干检测点,直至检测点对应的像素值中存在黑色像素点的像素值,然后继续进行黑点辐射检测,直至得到另一有效字符区块。
具体地,向有效字符区域上随机投射若干检测点,获取每个检测点对应的像素值,若对应的像素值中存在黑色像素点的像素值,则选取任一黑色像素点作为辐射起点向外进行黑点辐射检测,以所述任一黑色像素点为中心在邻近方向上继续检测黑色像素点,每检测到一个新黑色像素点就以该点为新的中心,继续在该新黑色像素点的邻近方向上继续检测,重复上述检测过程,直至检测不到新的黑色像素点,则全部探索到的黑色像素点就构成一有效字符区块。若对应的像素值中不存在黑色像素点的像素值,则继续向对象文本上随机投射若干检测点,直至检测点对应的像素值中存在黑色像素点的像素值,然后继续进行黑点辐射检测,直至得到另一有效字符区块。
基于上述系统实施例的内容,作为一种可选的实施例,本发明实施例中提供的流域资源环境案件数据采集系统,所述案由种类包括:中外合作勘探开发自然资源合同纠纷、养殖权纠纷、取水权纠纷、捕捞权纠纷、水污染责任纠纷、污染环境罪、渔业承包合同纠纷、环境保护、环境污染责任纠纷、环境监管失职罪、船舶污染损害责任纠纷、重大环境污染事故罪、非法处置进口固体废物罪和非法捕捞水产品罪。
基于上述系统实施例的内容,作为一种可选的实施例,本发明实施例中提供的流域资源环境案件数据采集系统,所述公益诉讼责任承担的种类包括:恢复原状、停止侵害、赔礼道歉、赔偿环境修复费、赔偿经济损失和消除危害。
本发明实施例提供的流域资源环境案件数据采集系统及设备,通过将多种功能模块进行系统集成,可以对流域资源环境案件进行准确收集,具有收集的流域资源环境案件泛化性好,收集过程快捷便利的特点,有效提高了流域资源环境案件的收集效率,降低了流域资源环境案件收集的经济成本。
本发明实施例的系统是依托电子设备实现的,因此对相关的电子设备有必要做一下介绍。基于此目的,本发明的实施例提供了一种电子设备,如图2所示,该电子设备包括:至少一个处理器(processor)201、通信接口(Communications Interface)204、至少一个存储器(memory)202和通信总线203,其中,至少一个处理器201,通信接口204,至少一个存储器202通过通信总线203完成相互间的通信。至少一个处理器201可以调用至少一个存储器202中的逻辑指令,以实现系统实施例中提供的各种系统。
此外,上述的至少一个存储器202中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的全部系统或部分系统。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)实现各个实施例或者实施例的某些部分所述的方法或系统。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。基于这种认识,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
在本专利中,术语"包括"、"包含"或者其任何其它变体意在涵盖非排它性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句"包括……"限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种流域资源环境案件数据采集系统,其特征在于,包括:案件关键词索引模块,用于根据案件关键词在网络上对已经公布的流域资源环境案件进行检索;案件确定模块,用于对检索到的流域资源环境案件进行识别,确定最终需要的流域资源环境案件;区域检索模块,用于对流域资源环境案件的检索区域进行限定;文书类型抓取模块,用于对审判的文书类型进行区别提取;案件类型抓取模块,用于对审判的案件类型进行区别提取;案件重要程度抓取模块,用于对案件的重要程度进行区别提取;审判法庭抓取模块,用于对审判法庭的种类进行区别提取;案由抓取模块,用于对案由种类进行区别提取;法院类型抓取模块,用于对法院种类进行区别提取;公益诉讼类型抓取模块,用于对公益诉讼的种类进行区别提取;公益诉讼责任承担方式抓取模块,用于对公益诉讼责任承担的种类进行提取;审判流程抓取模块,用于对审判流程的终止节点进行区别提取;证据适用性抓取模块,用于对证据的适用结果进行区别提取。
2.根据权利要求1所述的流域资源环境案件数据采集系统,其特征在于,所述对检索到的流域资源环境案件进行识别,确定最终需要的流域资源环境案件,包括:从检索到的流域资源环境案件中提取对象文本,对所述对象文本进行滤波去噪,在去噪后的对象文本中锁定有效字符,并将有效字符区块化得到若干字符区块,对每个字符区块中的像素点的像素值进行二值化,并归一化每个二值化字符区块中的尺寸,得到若干第一字符区块,将每个第一字符区块中的直流分量调整为0,交流分量的平均功率调整为1,得到若干调整字符区块,将每个调整字符区块加载于底衬文本的中心位置,得到每个调整字符区块对应的版块图,将每个板块图输入到预先训练的卷积神经网络中进行识别,获得每个板块图的文字识别结果,根据所述文字识别结果确定最终需要的流域资源环境案件;其中,底衬文本中像素点的灰度值均为0。
3.根据权利要求2所述的流域资源环境案件数据采集系统,其特征在于,所述对所述对象文本进行滤波去噪,包括:
Figure FDA0003052941680000011
其中,A为滤波去噪后对象文本中像素点的灰度值;Z为对象文本中像素点的数量;x为像素点的横坐标;y为像素点的纵坐标;W为像素点(x,y)领域点的坐标集合;C为对象文本中每个像素点的灰度值;m为领域点的横坐标;n为领域点的纵坐标。
4.根据权利要求2所述的流域资源环境案件数据采集系统,其特征在于,所述并将有效字符区块化得到若干字符区块,包括:向有效字符区域上随机投射若干检测点,获取每个检测点对应的像素值,若对应的像素值中存在黑色像素点的像素值,则选取任一黑色像素点作为辐射起点向外进行黑点辐射检测,则全部经过黑点辐射检测到的黑色像素点就构成一有效字符区块。
5.根据权利要求4所述的流域资源环境案件数据采集系统,其特征在于,所述则选取任一黑色像素点作为辐射起点向外进行黑点辐射检测,包括:以所述任一黑色像素点为中心在邻近方向上继续检测黑色像素点,将检测到的新黑色像素点作为新中心,在新中心的邻近方向上继续检测,直至检测不到新的黑色像素点;其中,所述邻近方向包括上方向、下方向、左方向、右方向、右上方向、右下方向、左上方向和左下方向。
6.根据权利要求4所述的流域资源环境案件数据采集系统,其特征在于,在所述则全部经过黑点辐射检测到的黑色像素点就构成一有效字符区块之后,还包括:若对应的像素值中不存在黑色像素点的像素值,则继续向有效字符区域上随机投射若干检测点,直至检测点对应的像素值中存在黑色像素点的像素值,然后继续进行黑点辐射检测,直至得到另一有效字符区块。
7.根据权利要求1所述的流域资源环境案件数据采集系统,其特征在于,所述案由种类包括:中外合作勘探开发自然资源合同纠纷、养殖权纠纷、取水权纠纷、捕捞权纠纷、水污染责任纠纷、污染环境罪、渔业承包合同纠纷、环境保护、环境污染责任纠纷、环境监管失职罪、船舶污染损害责任纠纷、重大环境污染事故罪、非法处置进口固体废物罪和非法捕捞水产品罪。
8.根据权利要求1所述的流域资源环境案件数据采集系统,其特征在于,所述公益诉讼责任承担的种类包括:恢复原状、停止侵害、赔礼道歉、赔偿环境修复费、赔偿经济损失和消除危害。
9.一种电子设备,其特征在于,包括:
至少一个处理器、至少一个存储器、通信接口和总线;其中,
所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以实现如权利要求1至8任一项权利要求所述的系统。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机实现如权利要求1至8中任一项权利要求所述的系统。
CN202110492352.3A 2021-05-06 2021-05-06 流域资源环境案件数据采集系统及设备 Pending CN113034318A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110492352.3A CN113034318A (zh) 2021-05-06 2021-05-06 流域资源环境案件数据采集系统及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110492352.3A CN113034318A (zh) 2021-05-06 2021-05-06 流域资源环境案件数据采集系统及设备

Publications (1)

Publication Number Publication Date
CN113034318A true CN113034318A (zh) 2021-06-25

Family

ID=76455039

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110492352.3A Pending CN113034318A (zh) 2021-05-06 2021-05-06 流域资源环境案件数据采集系统及设备

Country Status (1)

Country Link
CN (1) CN113034318A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130063483A1 (en) * 2011-09-12 2013-03-14 Xerox Corporation System and method to enable correction to application of substantially colorless material over identified text via segmentation
CN104200239A (zh) * 2014-09-09 2014-12-10 河海大学常州校区 一种基于图像特征融合识别的签名鉴伪系统及方法
CN109685050A (zh) * 2018-11-12 2019-04-26 平安科技(深圳)有限公司 文字识别方法、装置、设备及存储介质
CN111680125A (zh) * 2020-06-05 2020-09-18 深圳市华云中盛科技股份有限公司 诉讼案件分析方法、装置、计算机设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130063483A1 (en) * 2011-09-12 2013-03-14 Xerox Corporation System and method to enable correction to application of substantially colorless material over identified text via segmentation
CN104200239A (zh) * 2014-09-09 2014-12-10 河海大学常州校区 一种基于图像特征融合识别的签名鉴伪系统及方法
CN109685050A (zh) * 2018-11-12 2019-04-26 平安科技(深圳)有限公司 文字识别方法、装置、设备及存储介质
CN111680125A (zh) * 2020-06-05 2020-09-18 深圳市华云中盛科技股份有限公司 诉讼案件分析方法、装置、计算机设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李兴国等: "基于滴水算法的验证码中粘连字符分割方法", 《计算机工程与应用》 *

Similar Documents

Publication Publication Date Title
Nguyen et al. Pavement crack detection using convolutional neural network
CN111931709B (zh) 遥感影像的水体提取方法、装置、电子设备及存储介质
CN110569899A (zh) 坝面缺陷分类模型训练方法及装置
CN108446700A (zh) 一种基于对抗攻击的车牌攻击生成方法
Ye et al. Diagnosis of sewer pipe defects on image recognition of multi-features and support vector machine in a southern Chinese city
CN112132852A (zh) 基于多背景色统计的自动抠图方法及装置
Xiao et al. Individual tree detection and crown delineation with 3D information from multi-view satellite images
CN113034318A (zh) 流域资源环境案件数据采集系统及设备
CN114155375A (zh) 机场道面病害检测的方法、装置、电子设备及存储介质
Leach et al. Data augmentation for improving deep learning models in building inspections or postdisaster evaluation
CN111311573B (zh) 枝条确定方法、装置及电子设备
Jung et al. Exploitation of deep learning in the automatic detection of cracks on paved roads
McKay et al. An automated approach to extracting river bank locations from aerial imagery using image texture
Huang et al. An improved adaptive width template method for crack detection of nuclear containments
CN110222622B (zh) 一种环境土壤检测方法及装置
CN114742204A (zh) 检测秸秆覆盖率的方法和装置
Dandu et al. Vehicular number plate recognition using edge detection and characteristic analysis of national number plates
Biyabani et al. Embedded real-time bilingual ALPR
Khan et al. Enhanced car number plate recognition (ECNPR) system by improving efficiency in preprocessing steps
Jang et al. A defect inspection method for machine vision using defect probability image with deep convolutional neural network
Kim et al. Research on Automatic Crack Detection for Concrete Infrastructures Using Image Processing and Deep Learning
Sirhan et al. Multilabel CNN Model for Asphalt Distress Classification
Johansson Small vessel detection in high quality optical satellite imagery
Moreno-García Digital interpretation of sensor-equipment diagrams.
Kang et al. Stochastic properties of coastal flooding events–Part 1: convolutional-neural-network-based semantic segmentation for water detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210625

RJ01 Rejection of invention patent application after publication