CN117592818B - 一种非法捕捞事件的辅助决策方法及装置 - Google Patents

一种非法捕捞事件的辅助决策方法及装置 Download PDF

Info

Publication number
CN117592818B
CN117592818B CN202410063899.5A CN202410063899A CN117592818B CN 117592818 B CN117592818 B CN 117592818B CN 202410063899 A CN202410063899 A CN 202410063899A CN 117592818 B CN117592818 B CN 117592818B
Authority
CN
China
Prior art keywords
case
fishing
decided
historical
subset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410063899.5A
Other languages
English (en)
Other versions
CN117592818A (zh
Inventor
余红楚
肖宇豪
周俊华
周丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University of Technology WUT
Original Assignee
Wuhan University of Technology WUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University of Technology WUT filed Critical Wuhan University of Technology WUT
Priority to CN202410063899.5A priority Critical patent/CN117592818B/zh
Publication of CN117592818A publication Critical patent/CN117592818A/zh
Application granted granted Critical
Publication of CN117592818B publication Critical patent/CN117592818B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • G06Q10/06375Prediction of business process outcome or impact based on a proposed change
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Primary Health Care (AREA)
  • Mining & Mineral Resources (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Agronomy & Crop Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Animal Husbandry (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供了一种非法捕捞事件的辅助决策方法及装置,其方法包括:获取历史非法捕捞案例数据集以及待决策捕捞案例;历史非法捕捞案例数据集包括多个历史非法捕捞案例;分别对待决策捕捞案例和多个历史非法捕捞案例进行预处理,对应获得待决策句向量和多个历史句向量;基于相似度确定模型确定待决策句向量和多个历史句向量的多个相似度值,并基于多个相似度值确定多个历史非法捕捞案例中与待决策捕捞案例对应的目标非法捕捞案例;基于历史非法捕捞案例数据集构建罚款金额预测模型,并将待决策捕捞案例输入至罚款金额预测模型中,获得待决策捕捞案例的预测罚款金额。本发明可以帮助相关机构和单位更科学、公正地评估和处理非法捕捞事件。

Description

一种非法捕捞事件的辅助决策方法及装置
技术领域
本发明涉及非法捕捞识别技术领域,具体涉及一种非法捕捞事件的辅助决策方法及装置。
背景技术
目前的判断捕捞行为是否为非法捕捞及罚款方法多依赖于人工巡查判断决策,无法有效地制止非法捕捞行为,往往存在判断主观性强、依赖专业人员经验、易于出错等缺点。
因此,亟需提供一种非法捕捞事件的辅助决策方法及装置,用于解决上述技术问题。
发明内容
有鉴于此,有必要提供一种非法捕捞事件的辅助决策方法及装置,用以解决现有技术中存在的生成的非法捕捞行为识别准确率低和罚款金额不合理的技术问题。
一方面,本发明提供了一种非法捕捞事件的辅助决策方法,包括:
获取历史非法捕捞案例数据集以及待决策捕捞案例;所述历史非法捕捞案例数据集包括多个历史非法捕捞案例;
分别对所述待决策捕捞案例和所述多个历史非法捕捞案例进行预处理,对应获得待决策句向量和多个历史句向量;
基于相似度确定模型确定所述待决策句向量和所述多个历史句向量的多个相似度值,并基于所述多个相似度值确定所述多个历史非法捕捞案例中与所述待决策捕捞案例对应的目标非法捕捞案例;
基于所述历史非法捕捞案例数据集构建罚款金额预测模型,并将所述待决策捕捞案例输入至所述罚款金额预测模型中,获得所述待决策捕捞案例的预测罚款金额。
在一些可能的实现方式中,所述待决策捕捞案例的数据类型为文本数据;则所述对所述待决策捕捞案例进行预处理,获得待决策句向量,包括:
采用Jieba分词工具对所述待决策捕捞案例进行分词处理,获得多个案例词语;
基于向量化模型对所述多个案例词语进行处理,获得多个案例词向量;
确定所述多个案例词语的多个词语权重,并基于所述多个词语权重和所述多个案例词向量确定所述待决策捕捞案例的待决策句向量。
在一些可能的实现方式中,所述待决策句向量为:
式中,为待决策句向量;/>为第i个案例词语的案例词向量;/>为i个案例词语的归一化TF-IDF权重值;/>为所有案例语句的TF-IDF权重值向量;/>为所有案例语句的归一化TF-IDF权重值向量;m为待决策捕捞案例中所有案例词语的个数;为第i个案例词语的原始TF-IDF权重值;n为多个历史非法捕捞案例的数量;/>为案例词语i的词频;/>为案例词语i的逆文档频率;/>为第i个案例词语出现在非法捕捞案例D中的次数;/>为包含案例词语i的非法捕捞案例的数量。
在一些可能的实现方式中,在所述分别对所述待决策捕捞案例和所述多个历史非法捕捞案例进行预处理之前,还包括:
确定所述多个历史非法捕捞案例中存在数据缺失的缺失案例,并将所述缺失案例剔除。
在一些可能的实现方式中,所述相似度确定模型为:
式中,为捕捞案例A的句向量;/>为捕捞案例B的句向量;/>取模运算符号。
在一些可能的实现方式中,所述基于所述历史非法捕捞案例数据集构建罚款金额预测模型,包括:
确定所述历史非法捕捞案例数据集中的训练子集;所述训练子集包括多个历史非法捕捞案例;
基于预设提取规则确定各所述历史非法捕捞案例的特征属性;
将所述特征属性的所有分支结果进行编码,获得标签编码;
基于所述标签编码、分裂指标和停树指标构建待剪枝罚款金额预测模型;
确定所述历史非法捕捞案例数据集中的验证子集,并确定所述待剪枝罚款金额预测模型的多个子树;
基于所述验证子集和剪枝评估指标确定各所述子树的剪枝评估值,当所述剪枝评估值大于评估标准值时,将所述子树进行剪枝,获得所述罚款金额预测模型。
在一些可能的实现方式中,所述待剪枝罚款金额预测模型包括多个分裂点,所述多个历史非法捕捞案例经过所述分裂点后划分为第一子集和第二子集,则所述分裂指标为:
式中,为分裂点的加权平方误差;/>为第一子集中的案例条数;/>为第一子集的平方误差;/>为第二子集中的案例条数;/>为第二子集的平方误差;/>为第一子集中第i个历史非法捕捞案例的输出值;/>为第二子集中第j个历史非法捕捞案例的输出值;/>为第一子集中所有历史非法捕捞案例的输出均值;/>为第二子集中所有历史非法捕捞案例的输出均值。
在一些可能的实现方式中,所述剪枝评估指标为:
式中,为第T个子树的剪枝评估值;/>为验证子集在第T个子树中运行获得的均方误差;/>为子数中的叶子节点数量;/>为设定参数。
在一些可能的实现方式中,在基于所述验证子集和剪枝评估指标确定各所述子树的剪枝评估值,当所述子树的剪枝评估值大于评估标准值时,将所述子树进行剪枝,获得所述罚款金额预测模型之后,还包括:
确定所述历史非法捕捞案例数据集中的测试子集;
将所述测试子集输入至所述罚款金额预测模型中,获得所述测试子集对应的罚款金额预测集;
基于所述罚款金额预测集和所述测试子集中的罚款金额真实值确定所述罚款金额预测模型是否满足要求。
另一方面,本发明还提供了一种非法捕捞事件的辅助决策装置,包括:
非法捕捞案件获取单元,用于获取历史非法捕捞案例数据集以及待决策捕捞案例;所述历史非法捕捞案例数据集包括多个历史非法捕捞案例;
分句向量确定单元,用于别对所述待决策捕捞案例和所述多个历史非法捕捞案例进行预处理,对应获得待决策句向量和多个历史句向量;
捕捞案例确定单元,用于基于相似度确定模型确定所述待决策句向量和所述多个历史句向量的多个相似度值,并基于所述多个相似度值确定所述多个历史非法捕捞案例中与所述待决策捕捞案例对应的目标非法捕捞案例;
罚款金额预测单元,用于基于所述历史非法捕捞案例数据集构建罚款金额预测模型,并将所述待决策捕捞案例输入至所述罚款金额预测模型中,获得所述待决策捕捞案例的预测罚款金额。
采用上述实施例的有益效果是:本发明提供的非法捕捞事件的辅助决策方法,通过分别对待决策捕捞案例和多个历史非法捕捞案例进行预处理,对应获得待决策句向量和多个历史句向量;基于相似度确定模型确定待决策句向量和多个历史句向量的多个相似度值,并基于多个相似度值确定多个历史非法捕捞案例中与待决策捕捞案例对应的目标非法捕捞案例,可从历史非法捕捞案例中获取与待决策捕捞案例相似度最高的目标非法捕捞案例,即:可基于历史非法捕捞案例为待决策捕捞案例提供决策支持。进一步地,由于没有完全一致的非法捕捞案例,为确保对待决策捕捞案例的罚款金额进行合理设置,本发明通过基于历史非法捕捞案例数据集构建的罚款金额预测模型对待决策捕捞案例的罚款金额进行预测,可进一步帮助相关机构和单位更科学、公正地评估和处理非法捕捞事件,实现对非法捕捞行为的有效打击和防范。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的非法捕捞事件的辅助决策方法的一个实施例流程示意图;
图2为本发明图1中S102中获得待决策句向量的一个实施例流程示意图;
图3为本发明提供的构建罚款金额预测模型的一个实施例流程示意图;
图4为本发明提供的罚款金额预测模型的一个实施例结构示意图;
图5为本发明提供的对罚款金额预测模型进行评估的一个实施例示意图;
图6为本发明提供的非法捕捞事件的辅助决策装置的一个实施例结构示意图;
图7为本发明提供的非法捕捞事件的辅助决策设备的一个实施例结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,示意性的附图并未按实物比例绘制。本发明中使用的流程图示出了根据本发明的一些实施例实现的操作。应当理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本发明内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器系统和/或微控制器系统中实现这些功能实体。
本发明实施例中所涉及的“第一”“第二”等描述仅用于描述目的,而不能理解为指示或者暗示其相对重要性或者隐含指明所指示的技术特征的数量。因此,限定有“第一”“第二”的技术特征可以明示或者隐含地包括至少一个该特征。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其他实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其他实施例相结合。
本发明提供了一种非法捕捞事件的辅助决策方法及装置,以下分别进行说明。
图1为本发明提供的非法捕捞事件的辅助决策方法的一个实施例流程示意图,如图1所示,非法捕捞事件的辅助决策方法包括:
S101、获取历史非法捕捞案例数据集以及待决策捕捞案例;历史非法捕捞案例数据集包括多个历史非法捕捞案例;
S102、分别对待决策捕捞案例和多个历史非法捕捞案例进行预处理,对应获得待决策句向量和多个历史句向量;
S103、基于相似度确定模型确定待决策句向量和多个历史句向量的多个相似度值,并基于多个相似度值确定多个历史非法捕捞案例中与待决策捕捞案例对应的目标非法捕捞案例;
S104、基于历史非法捕捞案例数据集构建罚款金额预测模型,并将待决策捕捞案例输入至罚款金额预测模型中,获得待决策捕捞案例的预测罚款金额。
与现有技术相比,本发明实施例提供的非法捕捞事件的辅助决策方法,通过分别对待决策捕捞案例和多个历史非法捕捞案例进行预处理,对应获得待决策句向量和多个历史句向量;基于相似度确定模型确定待决策句向量和多个历史句向量的多个相似度值,并基于多个相似度值确定多个历史非法捕捞案例中与待决策捕捞案例对应的目标非法捕捞案例,可从历史非法捕捞案例中获取与待决策捕捞案例相似度最高的目标非法捕捞案例,即:可基于历史非法捕捞案例为待决策捕捞案例提供决策支持。进一步地,由于没有完全一致的非法捕捞案例,为确保对待决策捕捞案例的罚款金额进行合理设置,本发明实施例通过基于历史非法捕捞案例数据集构建的罚款金额预测模型对待决策捕捞案例的罚款金额进行预测,可进一步帮助相关机构和单位更科学、公正地评估和处理非法捕捞事件,实现对非法捕捞行为的有效打击和防范。
其中,步骤S101中获取历史非法捕捞案例数据集的具体过程为:从相关网站中公开发布的大数据中进行检索和下载,获得历史非法捕捞案例数据集。
其中,历史非法捕捞案例数据集中包括但不限于非法捕捞案例的1)基本信息,如案例公布年份、地区等;2)非法捕捞相关信息,如非法捕捞的作业方式、网目尺寸、渔获重量及案值等;3)生态损害修复信息,如赔偿金额、修复措施等。
需要说明的是:步骤S103中,目标非法捕捞案例为与待决策捕捞案例相似度值高于相似度阈值的历史非法捕捞案例。
在本发明的具体实施例中,相似度阈值为70%。
在本发明的一些实施例中,待决策捕捞案例的数据类型为文本数据;则如图2所示,步骤S102中对待决策捕捞案例进行预处理,获得待决策句向量,包括:
S201、采用Jieba分词工具对待决策捕捞案例进行分词处理,获得多个案例词语;
S202、基于向量化模型对多个案例词语进行处理,获得多个案例词向量;
S203、确定多个案例词语的多个词语权重,并基于多个词语权重和多个案例词向量确定待决策捕捞案例的待决策句向量。
需要说明的是:为了确保步骤S201中分词处理的准确性,在执行步骤S201之前,在Jieba分词工具中进行以下三种处理:1)加入包含海域交通专业词语的自定义词典;2)停用词过滤;3)采用精确模式分词。
其中,步骤S202中的向量化模型可为Word2Vec模型。
应当理解的是:步骤S102中对多个历史非法捕捞案例进行预处理的方法和步骤与对待决策捕捞案例进行预处理的方法和步骤一样,可参见上述步骤S201-步骤S203,在此不作赘述。
在本发明的一些实施例中,待决策句向量为:
式中,为待决策句向量;/>为第i个案例词语的案例词向量;/>为i个案例词语的归一化TF-IDF权重值;/>为所有案例语句的TF-IDF权重值向量;/>为所有案例语句的归一化TF-IDF权重值向量;m为待决策捕捞案例中所有案例词语的个数;为第i个案例词语的原始TF-IDF权重值;n为多个历史非法捕捞案例的数量;/>为案例词语i的词频;/>为案例词语i的逆文档频率;/>为第i个案例词语出现在非法捕捞案例D中的次数;/>为包含案例词语i的非法捕捞案例的数量。
由于历史非法捕捞案例中的数据可能会存在缺失,若对缺失的数据进行补齐处理的话,是将人为主观估计值进行补齐,不一定完全符合客观事实,为了避免数据的不合理补齐对辅助决策的结果造成影像,在本发明的一些实施例中,在步骤S102之前,还包括:
确定多个历史非法捕捞案例中存在数据缺失的缺失案例,并将缺失案例剔除。
本发明实施例通过将缺失案例剔除,实现了全部使用完全符合客观事实的数据进行辅助决策,提高了辅助决策的准确性。
在本发明的一些实施例中,相似度确定模型为:
式中,为捕捞案例A的句向量;/>为捕捞案例B的句向量;/>取模运算符号。
在本发明的一些实施例中,如图3所示,步骤S104中的基于历史非法捕捞案例数据集构建罚款金额预测模型,包括:
S301、确定历史非法捕捞案例数据集中的训练子集;训练子集包括多个历史非法捕捞案例;
S302、基于预设提取规则确定各历史非法捕捞案例的特征属性;
S303、将特征属性的所有分支结果进行编码,获得标签编码;
S304、基于标签编码、分裂指标和停树指标构建待剪枝罚款金额预测模型;
S305、确定历史非法捕捞案例数据集中的验证子集,并确定待剪枝罚款金额预测模型的多个子树;
S306、基于验证子集和剪枝评估指标确定各子树的剪枝评估值,当剪枝评估值大于评估标准值时,将子树进行剪枝,获得罚款金额预测模型。
本发明实施例通过基于验证子集对待剪枝罚款金额预测模型进行剪枝处理,获得罚款金额预测模型,可避免罚款金额预测模型过拟合,提高了罚款金额预测模型的泛化能力。
在本发明的具体实施例中,步骤S302具体为:提取以下七种特征属性:1)是否捕捞珍稀鱼类?分支结果为以下两种:1、是,2、否。2)使用的渔具?分支结果为以下三种:1、网目小于规定的网具或底部拖网,2、吊杆式或过于高效的捕捞工具,3、其他。3)采用的捕捞行为?分支结果为以下四种:1、电鱼,毒鱼,炸鱼,2、敲舫作业,3、使用鱼鹰捕鱼,4、其他。4)捕捞所处水域?分支结果为以下三种:1、海洋水域,2、内陆水域,3、长江等保护流域。5)是否持有捕捞证?分支结果为以下两种:1、有,2、没有。6)是否持有船舶航行证件?分支结果为以下两种:1、有,2、没有。7)捕捞渔获物数量?分支结果为以下三种:1、条级(少量),2、千克级(多量),3、吨级(大量)。
其中,步骤S303具体为:将上述七种特征属性按照其分支结果分为19种用于待剪枝罚款金额预测模型分裂节点的选择。且编码方式为独热(one-hot)编码。其中,19种分支结果具体为,第一种特征属性包括是或否两种分支结果,第二种特征属性包括3种分支结果,将七种特征属性的分支结果进行加和,共有19种分支结果。
需要说明的是:步骤S304具体为:将标签编码作为不同的分裂点,基于分裂指标确定每个分裂点的分裂指标值,将最小分裂指标值对应的分裂点作为实际分裂点,依此类推,构建出待剪枝罚款金额预测模型。
在本发明的一些实施例中,多个历史非法捕捞案例经过分裂点后划分为第一子集和第二子集,则分裂指标为:
式中,为分裂点的加权平方误差;/>为第一子集中的案例条数;/>为第一子集的平方误差;/>为第二子集中的案例条数;/>为第二子集的平方误差;/>为第一子集中第i个历史非法捕捞案例的输出值;/>为第二子集中第j个历史非法捕捞案例的输出值;/>为第一子集中所有历史非法捕捞案例的输出均值;/>为第二子集中所有历史非法捕捞案例的输出均值。
其中,步骤S304中的停树指标为决策树最大高度或节点中的最小样本数。
在本发明的具体实施例中,剪枝评估指标为:
式中,为第T个子树的剪枝评估值;/>为验证子集在第T个子树中运行获得的均方误差;/>为子数中的叶子节点数量;/>为设定参数,用于平衡模型的拟合能力和模型的复杂度。
在本发明的具体实施例中,如图4所示(图中部分节点未示出,用省略号代替具体内容),罚款金额预测模型的构建过程为:罚款金额预测模型的深度设为4,原始数据量为43条案例数据,将其分为训练集(34条)与测试集(9条)。根据分裂指标值平方误差的计算,根节点选择捕捞渔获物数量是否为千克级(多量),训练集经过二叉结构进行分支,捕捞数量为千克级的数据案例分流进入左子节点,判定依据选择为捕捞水域是否为海洋水域,共有23条案例数据。捕捞数量不为千克级的数据案例分流进入右子节点,判定依据选择为捕捞水域是否为内陆水域,共有11条案例数据。基于上述每一个新的子节点,都将重复计算所有标签编码的平方误差,并选择使其最小的标签进行进一步划分。这个过程会递归地持续,直到决策树模型深度为4。
为测试本发明实施例构建的罚款金额预测模型的准确性,在本发明的一些实施例中,如图5所示,在步骤S306之后,还包括:
S501、确定历史非法捕捞案例数据集中的测试子集;
S502、将测试子集输入至罚款金额预测模型中,获得测试子集对应的罚款金额预测集;
S503、基于罚款金额预测集和测试子集中的罚款金额真实值确定罚款金额预测模型是否满足要求。
其中,步骤S503具体为:当罚款金额真实值与罚款金额预测集中的罚款金额预测值的差值大于预设差值时,罚款金额预测模型不符合要求,需重新训练。当罚款金额真实值与罚款金额预测集中的罚款金额预测值的差值小于或等于预设差值时,罚款金额预测模型满足要求,可基于罚款金额预测模型对罚款进行实际预测。
为了更好实施本发明实施例中的非法捕捞事件的辅助决策方法,在非法捕捞事件的辅助决策方法基础之上,对应的,本发明实施例还提供了一种非法捕捞事件的辅助决策装置,如图6所示,非法捕捞事件的辅助决策装置600包括:
非法捕捞案件获取单元601,用于获取历史非法捕捞案例数据集以及待决策捕捞案例;历史非法捕捞案例数据集包括多个历史非法捕捞案例;
分句向量确定单元602,用于别对待决策捕捞案例和多个历史非法捕捞案例进行预处理,对应获得待决策句向量和多个历史句向量;
捕捞案例确定单元603,用于基于相似度确定模型确定待决策句向量和多个历史句向量的多个相似度值,并基于多个相似度值确定多个历史非法捕捞案例中与待决策捕捞案例对应的目标非法捕捞案例;
罚款金额预测单元604,用于基于历史非法捕捞案例数据集构建罚款金额预测模型,并将待决策捕捞案例输入至罚款金额预测模型中,获得待决策捕捞案例的预测罚款金额。
上述实施例提供的非法捕捞事件的辅助决策装置600可实现上述非法捕捞事件的辅助决策方法实施例中描述的技术方案,上述各模块或单元具体实现的原理可参见上述非法捕捞事件的辅助决策方法实施例中的相应内容,此处不再赘述。
如图7所示,本发明还相应提供了一种非法捕捞事件的辅助决策设备700。该非法捕捞事件的辅助决策设备700包括处理器701、存储器702及显示器703。图7仅示出了非法捕捞事件的辅助决策设备700的部分组件,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
处理器701在一些实施例中可以是中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行存储器702中存储的程序代码或处理数据,例如本发明中的非法捕捞事件的辅助决策方法。
在一些实施例中,处理器701可以是单个服务器或服务器组。服务器组可为集中式或分布式的。在一些实施例中,处理器701可为本地的或远程的。在一些实施例中,处理器701可实施于云平台。在一实施例中,云平台可包括私有云、公共云、混合云、社区云、分布式云、内部间、多重云等,或以上的任意组合。
存储器702在一些实施例中可以是非法捕捞事件的辅助决策设备700的内部存储单元,例如非法捕捞事件的辅助决策设备700的硬盘或内存。存储器702在另一些实施例中也可以是非法捕捞事件的辅助决策设备700的外部存储设备,例如非法捕捞事件的辅助决策设备700上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。
进一步地,存储器702还可既包括非法捕捞事件的辅助决策设备700的内部储存单元也包括外部存储设备。存储器702用于存储安装非法捕捞事件的辅助决策设备700的应用软件及各类数据。
显示器703在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。显示器703用于显示在非法捕捞事件的辅助决策设备700的信息以及用于显示可视化的用户界面。非法捕捞事件的辅助决策设备700的部件701-703通过系统总线相互通信。
在一实施例中,当处理器701执行存储器702中的非法捕捞事件的辅助决策程序时,可实现以下步骤:
获取历史非法捕捞案例数据集以及待决策捕捞案例;历史非法捕捞案例数据集包括多个历史非法捕捞案例;
分别对待决策捕捞案例和多个历史非法捕捞案例进行预处理,对应获得待决策句向量和多个历史句向量;
基于相似度确定模型确定待决策句向量和多个历史句向量的多个相似度值,并基于多个相似度值确定多个历史非法捕捞案例中与待决策捕捞案例对应的目标非法捕捞案例;
基于历史非法捕捞案例数据集构建罚款金额预测模型,并将待决策捕捞案例输入至罚款金额预测模型中,获得待决策捕捞案例的预测罚款金额。
应当理解的是:处理器701在执行存储器702中的非法捕捞事件的辅助决策程序时,除了上面的功能之外,还可实现其他功能,具体可参见前面相应方法实施例的描述。
进一步地,本发明实施例对提及的非法捕捞事件的辅助决策设备700的类型不做具体限定,非法捕捞事件的辅助决策设备700可以为手机、平板电脑、个人数字助理(personaldigital assistant,PDA)、可穿戴设备、膝上型计算机(laptop)等便携式非法捕捞事件的辅助决策设备。便携式非法捕捞事件的辅助决策设备的示例性实施例包括但不限于搭载IOS、android、microsoft或者其他操作系统的便携式非法捕捞事件的辅助决策设备。上述便携式非法捕捞事件的辅助决策设备也可以是其他便携式非法捕捞事件的辅助决策设备,诸如具有触敏表面(例如触控面板)的膝上型计算机(laptop)等。还应当理解的是,在本发明其他一些实施例中,非法捕捞事件的辅助决策设备700也可以不是便携式非法捕捞事件的辅助决策设备,而是具有触敏表面(例如触控面板)的台式计算机。
相应地,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质用于存储计算机可读取的程序或指令,程序或指令被处理器执行时,能够实现上述各方法实施例提供的非法捕捞事件的辅助决策方法中的步骤或功能。
本领域技术人员可以理解,实现上述实施例方法的全部或部分流程,可以通过计算机程序来指令相关的硬件(如处理器,控制器等)来完成,计算机程序可存储于计算机可读存储介质中。其中,计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。
以上对本发明所提供的非法捕捞事件的辅助决策方法及装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (6)

1.一种非法捕捞事件的辅助决策方法,其特征在于,包括:
获取历史非法捕捞案例数据集以及待决策捕捞案例;所述历史非法捕捞案例数据集包括多个历史非法捕捞案例;
分别对所述待决策捕捞案例和所述多个历史非法捕捞案例进行预处理,对应获得待决策句向量和多个历史句向量;
基于相似度确定模型确定所述待决策句向量和所述多个历史句向量的多个相似度值,并基于所述多个相似度值确定所述多个历史非法捕捞案例中与所述待决策捕捞案例对应的目标非法捕捞案例;
基于所述历史非法捕捞案例数据集构建罚款金额预测模型,并将所述待决策捕捞案例输入至所述罚款金额预测模型中,获得所述待决策捕捞案例的预测罚款金额;
所述待决策捕捞案例的数据类型为文本数据;则所述对所述待决策捕捞案例进行预处理,获得待决策句向量,包括:
采用Jieba分词工具对所述待决策捕捞案例进行分词处理,获得多个案例词语;
基于向量化模型对所述多个案例词语进行处理,获得多个案例词向量;
确定所述多个案例词语的多个词语权重,并基于所述多个词语权重和所述多个案例词向量确定所述待决策捕捞案例的待决策句向量;
所述基于所述历史非法捕捞案例数据集构建罚款金额预测模型,包括:
确定所述历史非法捕捞案例数据集中的训练子集;所述训练子集包括多个历史非法捕捞案例;
基于预设提取规则确定各所述历史非法捕捞案例的特征属性;
将所述特征属性的所有分支结果进行编码,获得标签编码;
基于所述标签编码、分裂指标和停树指标构建待剪枝罚款金额预测模型;
确定所述历史非法捕捞案例数据集中的验证子集,并确定所述待剪枝罚款金额预测模型的多个子树;
基于所述验证子集和剪枝评估指标确定各所述子树的剪枝评估值,当所述剪枝评估值大于评估标准值时,将所述子树进行剪枝,获得所述罚款金额预测模型;
所述待剪枝罚款金额预测模型包括多个分裂点,所述多个历史非法捕捞案例经过所述分裂点后划分为第一子集和第二子集,则所述分裂指标为:
式中,为分裂点的加权平方误差;/>为第一子集中的案例条数;/>为第一子集的平方误差;/>为第二子集中的案例条数;/>为第二子集的平方误差;/>为第一子集中第i个历史非法捕捞案例的输出值;/>为第二子集中第j个历史非法捕捞案例的输出值;/>为第一子集中所有历史非法捕捞案例的输出均值;/>为第二子集中所有历史非法捕捞案例的输出均值;
所述剪枝评估指标为:
式中,为第T个子树的剪枝评估值;/>为验证子集在第T个子树中运行获得的均方误差;/>为子数中的叶子节点数量;/>为设定参数;
其中,停树指标为决策树最大高度或节点中的最小样本数。
2.根据权利要求1所述的非法捕捞事件的辅助决策方法,其特征在于,所述待决策句向量为:
式中,为待决策句向量;/>为第i个案例词语的案例词向量;/>为i个案例词语的归一化TF-IDF权重值;/>为所有案例语句的TF-IDF权重值向量;/>为所有案例语句的归一化TF-IDF权重值向量;m为待决策捕捞案例中所有案例词语的个数;/>为第i个案例词语的原始TF-IDF权重值;n为多个历史非法捕捞案例的数量;/>为案例词语i的词频;/>为案例词语i的逆文档频率;/>为第i个案例词语出现在非法捕捞案例D中的次数;/>为包含案例词语i的非法捕捞案例的数量。
3.根据权利要求1所述的非法捕捞事件的辅助决策方法,其特征在于,在所述分别对所述待决策捕捞案例和所述多个历史非法捕捞案例进行预处理之前,还包括:
确定所述多个历史非法捕捞案例中存在数据缺失的缺失案例,并将所述缺失案例剔除。
4.根据权利要求1所述的非法捕捞事件的辅助决策方法,其特征在于,所述相似度确定模型为:
式中,为捕捞案例A的句向量;/>为捕捞案例B的句向量;/>取模运算符号。
5.根据权利要求1所述的非法捕捞事件的辅助决策方法,其特征在于,在基于所述验证子集和剪枝评估指标确定各所述子树的剪枝评估值,当所述子树的剪枝评估值大于评估标准值时,将所述子树进行剪枝,获得所述罚款金额预测模型之后,还包括:
确定所述历史非法捕捞案例数据集中的测试子集;
将所述测试子集输入至所述罚款金额预测模型中,获得所述测试子集对应的罚款金额预测集;
基于所述罚款金额预测集和所述测试子集中的罚款金额真实值确定所述罚款金额预测模型是否满足要求。
6.一种非法捕捞事件的辅助决策装置,其特征在于,包括:
非法捕捞案件获取单元,用于获取历史非法捕捞案例数据集以及待决策捕捞案例;所述历史非法捕捞案例数据集包括多个历史非法捕捞案例;
分句向量确定单元,用于别对所述待决策捕捞案例和所述多个历史非法捕捞案例进行预处理,对应获得待决策句向量和多个历史句向量;
捕捞案例确定单元,用于基于相似度确定模型确定所述待决策句向量和所述多个历史句向量的多个相似度值,并基于所述多个相似度值确定所述多个历史非法捕捞案例中与所述待决策捕捞案例对应的目标非法捕捞案例;
罚款金额预测单元,用于基于所述历史非法捕捞案例数据集构建罚款金额预测模型,并将所述待决策捕捞案例输入至所述罚款金额预测模型中,获得所述待决策捕捞案例的预测罚款金额;
所述待决策捕捞案例的数据类型为文本数据;则所述对所述待决策捕捞案例进行预处理,获得待决策句向量,包括:
采用Jieba分词工具对所述待决策捕捞案例进行分词处理,获得多个案例词语;
基于向量化模型对所述多个案例词语进行处理,获得多个案例词向量;
确定所述多个案例词语的多个词语权重,并基于所述多个词语权重和所述多个案例词向量确定所述待决策捕捞案例的待决策句向量;
所述基于所述历史非法捕捞案例数据集构建罚款金额预测模型,包括:
确定所述历史非法捕捞案例数据集中的训练子集;所述训练子集包括多个历史非法捕捞案例;
基于预设提取规则确定各所述历史非法捕捞案例的特征属性;
将所述特征属性的所有分支结果进行编码,获得标签编码;
基于所述标签编码、分裂指标和停树指标构建待剪枝罚款金额预测模型;
确定所述历史非法捕捞案例数据集中的验证子集,并确定所述待剪枝罚款金额预测模型的多个子树;
基于所述验证子集和剪枝评估指标确定各所述子树的剪枝评估值,当所述剪枝评估值大于评估标准值时,将所述子树进行剪枝,获得所述罚款金额预测模型;
所述待剪枝罚款金额预测模型包括多个分裂点,所述多个历史非法捕捞案例经过所述分裂点后划分为第一子集和第二子集,则所述分裂指标为:
式中,为分裂点的加权平方误差;/>为第一子集中的案例条数;/>为第一子集的平方误差;/>为第二子集中的案例条数;/>为第二子集的平方误差;/>为第一子集中第i个历史非法捕捞案例的输出值;/>为第二子集中第j个历史非法捕捞案例的输出值;/>为第一子集中所有历史非法捕捞案例的输出均值;/>为第二子集中所有历史非法捕捞案例的输出均值;
所述剪枝评估指标为:
式中,为第T个子树的剪枝评估值;/>为验证子集在第T个子树中运行获得的均方误差;/>为子数中的叶子节点数量;/>为设定参数;
其中,停树指标为决策树最大高度或节点中的最小样本数。
CN202410063899.5A 2024-01-17 2024-01-17 一种非法捕捞事件的辅助决策方法及装置 Active CN117592818B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410063899.5A CN117592818B (zh) 2024-01-17 2024-01-17 一种非法捕捞事件的辅助决策方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410063899.5A CN117592818B (zh) 2024-01-17 2024-01-17 一种非法捕捞事件的辅助决策方法及装置

Publications (2)

Publication Number Publication Date
CN117592818A CN117592818A (zh) 2024-02-23
CN117592818B true CN117592818B (zh) 2024-04-09

Family

ID=89910194

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410063899.5A Active CN117592818B (zh) 2024-01-17 2024-01-17 一种非法捕捞事件的辅助决策方法及装置

Country Status (1)

Country Link
CN (1) CN117592818B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107329949A (zh) * 2017-05-24 2017-11-07 北京捷通华声科技股份有限公司 一种语义匹配方法和系统
CN111222526A (zh) * 2018-11-27 2020-06-02 中电科海洋信息技术研究院有限公司 一种渔船实时捕捞行为识别方法、装置、设备及存储介质
CN112733935A (zh) * 2021-01-08 2021-04-30 上海大学 一种基于Stacking算法的渔船捕捞方式预测方法
CN112966521A (zh) * 2021-03-01 2021-06-15 北京新方通信技术有限公司 一种短句相似度的计算方法及系统
CN113361614A (zh) * 2021-06-15 2021-09-07 广西民族大学 一种船只捕鱼行为预测方法
CN113779969A (zh) * 2021-09-16 2021-12-10 平安国际智慧城市科技股份有限公司 基于人工智能的案件信息处理方法、装置、设备及介质
CN114373165A (zh) * 2022-03-22 2022-04-19 江西省天轴通讯有限公司 基于图像识别的执法分析方法、装置、存储介质及设备
CN115631010A (zh) * 2022-09-16 2023-01-20 宁波海上鲜信息技术股份有限公司 一种基于数字化渔业的动态捕捞方法和系统
CN115936215A (zh) * 2022-12-05 2023-04-07 华东理工大学 一种基于在线流数据挖掘算法预测非法渔船动向的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106651616B (zh) * 2016-12-26 2021-06-18 上海海洋大学 一种中西太平洋鲣鱼围网渔业入渔的预测方法
WO2021178731A1 (en) * 2020-03-04 2021-09-10 Karl Denninghoff Neurological movement detection to rapidly draw user attention to search results

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107329949A (zh) * 2017-05-24 2017-11-07 北京捷通华声科技股份有限公司 一种语义匹配方法和系统
CN111222526A (zh) * 2018-11-27 2020-06-02 中电科海洋信息技术研究院有限公司 一种渔船实时捕捞行为识别方法、装置、设备及存储介质
CN112733935A (zh) * 2021-01-08 2021-04-30 上海大学 一种基于Stacking算法的渔船捕捞方式预测方法
CN112966521A (zh) * 2021-03-01 2021-06-15 北京新方通信技术有限公司 一种短句相似度的计算方法及系统
CN113361614A (zh) * 2021-06-15 2021-09-07 广西民族大学 一种船只捕鱼行为预测方法
CN113779969A (zh) * 2021-09-16 2021-12-10 平安国际智慧城市科技股份有限公司 基于人工智能的案件信息处理方法、装置、设备及介质
CN114373165A (zh) * 2022-03-22 2022-04-19 江西省天轴通讯有限公司 基于图像识别的执法分析方法、装置、存储介质及设备
CN115631010A (zh) * 2022-09-16 2023-01-20 宁波海上鲜信息技术股份有限公司 一种基于数字化渔业的动态捕捞方法和系统
CN115936215A (zh) * 2022-12-05 2023-04-07 华东理工大学 一种基于在线流数据挖掘算法预测非法渔船动向的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Deep Nets Spotlight Illegal, Unreported, Unregulated (IUU) Fishing;Darrell L. Young;《2019 IEEE Applied Imagery Pattern Recognition Workshop (AIPR)》;20200824;1-7 *
利用机器学习算法的海洋渔船捕捞能力影响因素权重分析;吕超;《农业工程学报》;20211231;第37卷(第13期);135-141 *

Also Published As

Publication number Publication date
CN117592818A (zh) 2024-02-23

Similar Documents

Publication Publication Date Title
CN111489297A (zh) 用于检测危险要素的学习用图像数据集的生成方法和装置
CN115034315B (zh) 基于人工智能的业务处理方法、装置、计算机设备及介质
Eadi Stringari et al. Deep neural networks for active wave breaking classification
CN111798123A (zh) 基于人工智能的合规性评价方法、装置、设备及介质
CN112507663A (zh) 基于文本的判断题生成方法、装置、电子设备及存储介质
CN113688232A (zh) 招标文本分类方法、装置、存储介质及终端
CN114896067A (zh) 任务请求信息的自动生成方法、装置、计算机设备及介质
CN115994688A (zh) 基于知识图谱的船舶事故风险评估方法、装置和电子设备
CN114726823A (zh) 一种基于生成对抗网络的域名生成方法、装置和设备
CN117743601B (zh) 一种自然资源知识图谱补全方法、装置、设备及介质
CN115829058A (zh) 训练样本处理方法、跨模态匹配方法、装置、设备和介质
CN117745680A (zh) 基于大型视觉语言模型的异常检测方法及装置
CN115330579A (zh) 模型水印的构建方法、装置、设备及存储介质
CN118262365A (zh) 基于sam的多层级文本检测方法及相关设备
CN117592818B (zh) 一种非法捕捞事件的辅助决策方法及装置
CN116227573A (zh) 分割模型训练方法、图像分割方法、装置及相关介质
CN115713082A (zh) 一种命名实体识别方法、装置、设备及存储介质
CN112685536B (zh) 文本对话方法、装置、电子设备及存储介质
CN115080745A (zh) 基于人工智能的多场景文本分类方法、装置、设备及介质
CN113836297A (zh) 文本情感分析模型的训练方法及装置
CN115146596B (zh) 召回文本的生成方法、装置、电子设备及存储介质
CN117992620B (zh) 一种基坑工程评估方法、系统、存储介质及电子设备
CN116611477B (zh) 数据剪枝方法和序列模型的训练方法、装置、设备和介质
CN115204120B (zh) 保险领域三元组抽取方法、装置、电子设备及存储介质
CN113434790B (zh) 重复链接的识别方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant