CN116011461B - 一种基于事件分类模型的概念抽象系统及方法 - Google Patents

一种基于事件分类模型的概念抽象系统及方法 Download PDF

Info

Publication number
CN116011461B
CN116011461B CN202310264026.6A CN202310264026A CN116011461B CN 116011461 B CN116011461 B CN 116011461B CN 202310264026 A CN202310264026 A CN 202310264026A CN 116011461 B CN116011461 B CN 116011461B
Authority
CN
China
Prior art keywords
semantic
node
event
module
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310264026.6A
Other languages
English (en)
Other versions
CN116011461A (zh
Inventor
宋永生
王楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wenling Technology Beijing Co ltd
Original Assignee
Wenling Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wenling Technology Beijing Co ltd filed Critical Wenling Technology Beijing Co ltd
Priority to CN202310264026.6A priority Critical patent/CN116011461B/zh
Publication of CN116011461A publication Critical patent/CN116011461A/zh
Application granted granted Critical
Publication of CN116011461B publication Critical patent/CN116011461B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Machine Translation (AREA)

Abstract

本发明提供了一种基于事件分类模型的概念抽象系统及方法,涉及计算机语言处理技术领域,将待输入事件信息输入信息缺陷检测模型中获取缺陷检测结果,进行语句分类并对存在缺陷的语句集合进行语句转换,将不存在缺陷的语句集合和转换语句集合输入语义识别模型,以每个语义元为节点搭建事件分类树,将一级叶节点作为事件分类模型的输出结果,解决了现有技术中事件分析方法不够智能化,识别过程不够灵活,使得识别效率低下且最终的解析结果较之需求信息不够精准,信息简洁度不足的技术问题,通过进行语句预处理,对预处理结果进行语义结构化,逐步构建事件分类树确定最终的主体事件,梳理完整的概念体系,在保障信息准确度的基础上进行信息简化。

Description

一种基于事件分类模型的概念抽象系统及方法
技术领域
本发明涉及计算机语言处理技术领域,具体涉及一种基于事件分类模型的概念抽象系统及方法。
背景技术
语言作为智能体之间沟通的媒介,不同的表述方式,不同的表述顺序,对应的语义不尽相同,对于信息量较大的事件,例如新闻稿件,可能存在着多个事件信息,进行事件解读分析时耗时过大且易出现理解偏差,可通过对主体事件进行标注,以便进行信息理解。
进行事件分类时,对于实体与实体之间的关系,例如从从汽车、飞机、船舶由可以抽象出交通工具等,可基于科学分类体系完成;但从具体事物归纳到抽象事物,由于事物存在多个方面,皆可作为分类与抽象的维度,难以进行具化。现如今,进行事件主架构提取作为分类辅助参考,只能通过识别相关联的事件句型进行获取,例如通过完整的事件表达式进行概念确定,使得最终的识别信息较之需求信息存在一定的偏差。
现有技术中,进行事件信息解读时,由于现有的事件分析方法不够智能化,识别过程不够灵活,使得识别效率低下且最终的解析结果较之需求信息不够精准,信息简洁度不足。
发明内容
本申请提供了一种基于事件分类模型的概念抽象系统及方法,用于针对解决现有技术中存在的事件分析方法不够智能化,识别过程不够灵活,使得识别效率低下且最终的解析结果较之需求信息不够精准,信息简洁度不足的技术问题。
鉴于上述问题,本申请提供了一种基于事件分类模型的概念抽象系统及方法。
第一方面,本申请提供了一种基于事件分类模型的概念抽象方法,所述方法包括:连接信息获取系统,获取待输入事件信息;将所述待输入事件信息输入信息缺陷检测模型中,根据所述缺陷检测模型,获取缺陷检测结果;基于所述缺陷检测结果,对所述待输入事件信息中的所有语句进行分类,获取存在缺陷的语句集合和不存在缺陷的语句集合;将所述存在缺陷的语句集合进行语句转换,获取转换语句集合;连接语义识别模型,将所述不存在缺陷的语句集合和所述转换语句集合输入所述语义识别模型中,根据所述语义识别模型,输出语义结构元集合,其中,所述语义结构元集合的数量与所述待输入事件信息的所有语句数量相同;根据所述语义结构元集合,以每个语义元为节点搭建事件分类树;以所述事件分类树的一级叶节点作为所述事件分类模型的输出结果。
第二方面,本申请提供了一种基于事件分类模型的概念抽象系统,所述系统包括:信息获取模块,所述信息获取模块用于连接信息获取系统,获取待输入事件信息;缺陷检测模块,所述缺陷检测模块用于将所述待输入事件信息输入信息缺陷检测模型中,根据所述缺陷检测模型,获取缺陷检测结果;语句分类模块,所述语句分类模块用于基于所述缺陷检测结果,对所述待输入事件信息中的所有语句进行分类,获取存在缺陷的语句集合和不存在缺陷的语句集合;语句转换模块,所述语句转换模块用于将所述存在缺陷的语句集合进行语句转换,获取转换语句集合;语义识别模块,所述语义识别模块用于连接语义识别模型,将所述不存在缺陷的语句集合和所述转换语句集合输入所述语义识别模型中,根据所述语义识别模型,输出语义结构元集合,其中,所述语义结构元集合的数量与所述待输入事件信息的所有语句数量相同;分类树搭建模块,所述分类树搭建模块用于根据所述语义结构元集合,以每个语义元为节点搭建事件分类树;结果输出模块,所述结果输出模块用于以所述事件分类树的一级叶节点作为所述事件分类模型的输出结果。
本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
本申请实施例提供的一种基于事件分类模型的概念抽象方法,连接信息获取系统,获取待输入事件信息,将所述待输入事件信息输入信息缺陷检测模型中进行缺陷检测,获取缺陷检测结果,进而对所述待输入事件信息中的所有语句进行分类,确定存在缺陷的语句集合和不存在缺陷的语句集合,对所述存在缺陷的语句集合进行语句转换获取转换语句集合,将所述不存在缺陷的语句集合和所述转换语句集合输入所述语义识别模型中,输出语义结构元集合,其中,所述语义结构元集合的数量与所述待输入事件信息的所有语句数量相同,以每个语义元为节点搭建事件分类树,以所述事件分类树的一级叶节点作为所述事件分类模型的输出结果,解决了现有技术中存在的事件分析方法不够智能化,识别过程不够灵活,使得识别效率低下且最终的解析结果较之需求信息不够精准,信息简洁度不足的技术问题,通过进行语句预处理,对预处理结果进行语义结构化,逐步构建事件分类树确定最终的主体事件,梳理完整的概念体系,在保障信息准确度的基础上进行信息简化。
附图说明
图1为本申请提供了一种基于事件分类模型的概念抽象方法流程示意图;
图2为本申请提供了一种基于事件分类模型的概念抽象方法中待转换语句集合获取流程示意图;
图3为本申请提供了一种基于事件分类模型的概念抽象方法中事件分类树搭建流程示意图;
图4为本申请提供了一种基于事件分类模型的概念抽象系统结构示意图。
附图标记说明:信息获取模块11,缺陷检测模块12,语句分类模块13,语句转换模块14,语义识别模块15,分类树搭建模块16,结果输出模块17。
具体实施方式
本申请通过提供一种基于事件分类模型的概念抽象系统及方法,将待输入事件信息输入信息缺陷检测模型中获取缺陷检测结果,进行语句分类并对存在缺陷的语句集合进行语句转换,将不存在缺陷的语句集合和转换语句集合输入语义识别模型,获取语义结构元集合,以每个语义元为节点搭建事件分类树,将一级叶节点作为事件分类模型的输出结果,用于解决现有技术中存在的事件分析方法不够智能化,识别过程不够灵活,使得识别效率低下且最终的解析结果较之需求信息不够精准,信息简洁度不足的技术问题。
实施例一
如图1所示,本申请提供了一种基于事件分类模型的概念抽象方法,所述方法包括:
步骤S100:连接信息获取系统,获取待输入事件信息;
具体而言,对于信息量较大的事件信息,进行事件主体解读与分析时,耗时过长且易出现解读偏差,可通过进行概念抽象进行事件结构化,进而进行事件分类细化,将事件分类模型作为辅助分析工具,基于多个需求切入点进行概念抽象化,例如行为主体规模、时空特性等,因此,事件分类模型的优劣直接影响着最终的概念抽象能效,本申请提供的一种基于事件分类模型的概念抽象方法,通过进行事件信息分析与缺陷语句识别转换,对经由预处理后的语句信息基于语义识别模型进行语句结构提取,确定对应的语义结构元,进一步进行语义结构元分层完成事件分类树的搭建,其中,所述事件分类树的一级叶节点为主体事件信息,所述事件分类模型为进行事件信息解析的辅助模型,首先,连接所述信息获取系统,所述信息获取系统为进行事件信息采集提取的中间系统,基于所述信息获取系统获取所述输入事件信息,所述输入事件信息为待进行事件解读分析的目标事件信息,将其作为信息源进行后续分析解读。
步骤S200:将所述待输入事件信息输入信息缺陷检测模型中,根据所述缺陷检测模型,获取缺陷检测结果;
步骤S300:基于所述缺陷检测结果,对所述待输入事件信息中的所有语句进行分类,获取存在缺陷的语句集合和不存在缺陷的语句集合;
具体而言,所述待输入事件信息中可能存在部分语句存在代指、表述不清等信息缺陷,后续进行语义识别分析时会对识别准确度造成影响,导致识别偏差,需提前对存在信息缺陷的语句进行检测调整,将所述待输入事件信息输入所述信息缺陷检测模型中,所述信息缺陷检测模型为对所述待输入事件信息各个语句分别进行语句结构信息识别,判断是否存在代指、表述不清等语句缺陷,其中,所述代指为采用代词进行名词表述,不同语境下的指代对象存在差异性,可能会存在指代不明,无法识别判断等情况,通过对所述待输入事件信息进行语句缺陷判断,分别进行各个语句的缺陷检测,生成所述缺陷检测结果,其中,所述缺陷检测结果与所述待输入事件信息包含的多个语句一一对应,进一步的,以所述缺陷检测结果为基准,对所述待输入事件信息中的所有语句进行分类,将所述待输入事件信息划分为所述存在缺陷的语句集合与所述不存在缺陷的语句集合,为后续进行缺陷语句的调整奠定了基础。
步骤S400:将所述存在缺陷的语句集合进行语句转换,获取转换语句集合;
具体而言,通过对所述待输入事件信息进行语句缺陷检测,获取所述存在缺陷的语句集合,进一步对其中的语句进行缺陷类型判定,示例性的,当语句缺陷为语序混乱时,进行语序调整,以避免后续语句结构出现识别判定偏差;当语句缺陷为代词指代不明时,结合该语句对应的语境与上下文,确定代词的具体指代对象,对代词与对应的指代对象进行转换调整,进行完整语句结构的表述转换,对于所述存在缺陷的语句集合中存在代词,但语句结构完整,可正确进行语句结构识别的语句无需进行转换,以减少转换信息量,提高语句处理速率,对所述存在缺陷的语句集合中存在语句转换必要性的语句进行转换,生成所述转换语句集合,通过进行语句转换,可提高所述待输入事件信息中语句的结构完整度与信息清楚度,为后续进行语义识别提供了基本信息源。
步骤S500:连接语义识别模型,将所述不存在缺陷的语句集合和所述转换语句集合输入所述语义识别模型中,根据所述语义识别模型,输出语义结构元集合,其中,所述语义结构元集合的数量与所述待输入事件信息的所有语句数量相同;
具体而言,连接所述语义识别模型,所述语义识别模型为进行语句结构分析与信息识别的辅助性模型,将所述不存在缺陷的语句集合与所述转换语句集合输入所述语义识别模型中,基于所述语义识别模型对接收的语句进行语句结构识别与语句表述模式转换,确定各语句对应的主体事件信息,识别语句主语、宾语、主体事件的进度与状态,将所述主体事件信息作为中心节点,识别的结构信息分别作为上下左右的分支节点,构成语义结构元,一个完整的语义结构元包括五部分,其中,所述待输入事件信息中各语句分别生成一语义结构元,两者一一对应,对生成的语义结构元进行汇总生成所述语义结构元集合,所述语义结构元集合的获取为后续事件分类树的搭建提供了信息支撑。
步骤S600:根据所述语义结构元集合,以每个语义元为节点搭建事件分类树;
步骤S700:以所述事件分类树的一级叶节点作为所述事件分类模型的输出结果。
具体而言,基于所述语义识别模型对所述待输入事件信息进行结构信息识别与表现模式转换,生成所述语义结构元集合,所述语义结构元集合的中心节点分别对应一中心节点事件,所述待输入事件信息可能包括了多个不同事件,遍历所述语义结构元集合,对语义结构元对应的中心节点事件进行比对分析,确定相邻中心节点事件之间的关联关系,确定对应的语义结构元属于同级事件分类节点或上下级子节点,随着所述语义结构元的遍历同步搭建所述事件分类树,当所述语义结构元集合遍历完成时同步搭建完成,生成所述事件分类树,所述事件分类树可视为完整的事物的层次网络,层级之间存在关联衔接,以提取事物的抽象概念。其中所述事件分类树的一级叶节点为所述待输入事件信息所包含的多个不同事件信息,所述一级叶节点对应的语义结构元为不同事件信息的总概,将所述事件分类树的所述一级叶节点作为所述事件分类模型的输出结果,以获取所述输入事件信息的主体事件信息,以提高阅读简洁性,提升阅读效率。
进一步而言,如图2所示,获取存在缺陷的语句集合和不存在缺陷的语句集合之后,本申请步骤S300还包括:
步骤S310:根据所述缺陷检测结果对所述存在缺陷的语句集合进行缺陷度检测,获取缺陷检测指标,其中,所述缺陷检测指标用于标识各个语句中存在缺陷的大小;
步骤S320:根据所述缺陷检测指标与预设缺陷检测指标进行判断,得到大于所述预设缺陷检测指标的语句集合;
步骤S330:将大于所述缺陷检测指标的语句集合作为待转换语句集合。
具体而言,通过对所述待输入事件信息进行缺陷检测,确定所述存在缺陷的语句集合与所述不存在缺陷的语句集合,提取所述存在缺陷的语句集合,与所述缺陷检测结果进行映射对应,获取多组映射结果,对所述多组映射结果分别进行语句缺陷度检测,确定所述存在缺陷的语句集合中各语句的缺陷大小,生成所述缺陷检测指标,所述缺陷检测指标与所述存在缺陷的语句集合一一对应,用于标识各个语句中存在缺陷的大小,进一步获取所述预设缺陷指标,所述预设缺陷指标为度量所述缺陷检测指标对应的语句存在语句转换必要性的指标临界值,对所述缺陷检测指标与所述预设缺陷检测指标进行比对判定,确定大于所述预设缺陷指标的缺陷检测指标,即对应的语句存在语句转换必要性,否则会对后续的语句识别造成影响,获取所述大于所述预设缺陷检测指标的语句集合,将所述大于所述缺陷检测指标的语句集合作为所述待转换语句集合,通过对缺陷语句进行指标比对分析,确定存在转换必要性的缺陷语句,可有效提高分析效率,避免无效做功。
进一步而言,根据所述缺陷检测指标与预设缺陷检测指标进行判断,本申请步骤S320还包括:
步骤S321:将小于等于所述缺陷检测指标的语句集合作为标识语句集合输出;
步骤S322:将所述标识语句集合、所述不存在缺陷的语句集合和所述转换语句集合输入所述语义识别模型中;
步骤S323:根据所述语义识别模型,输出所述语义结构元集合,包括标识语义结构元集合、正常语义结构元集合和转换语义结构元集合。
具体而言,通过对所述缺陷检测指标与所述预设缺陷检测指标进行判断,获取其中小于等于所述缺陷检测指标的语句集合,对其中的语句缺陷结构部分进行标识,将其作为所述标识语句集合进行输出,所述标识语句集合为存在语句缺陷但对后续语义识别不会造成影响,可进行适当忽略的语句集合,进一步将所述标识语句集合、所述不存在缺陷的语句集合与所述转换语句集合输入所述语义识别模型中,所述语句识别模型可对输入的语句进行语句结构识别与解析,输出对应的语义结构元,所述语义结构元将语句转换为对应的数据元素,一个语义结构元包括上下左右和中心,中心为事件主体,上为主语,下为宾语,左为进度、右为状态,将其数据抽象化,便于进行事件信息的语句分层,使得事件信息清晰化,通过所述语义识别模型进行语句分析,输出所述标识语义结构元集合、所述正常语义结构元集合与所述转换语义结构元集合,获取所述语义结构元集合,通过将语句转换为所述语义结构元,为后续事件分类树的搭建夯实了基础。
进一步而言,将所述标识语句集合、所述不存在缺陷的语句集合和所述转换语句集合输入所述语义识别模型中之后,本申请步骤S322还包括:
步骤S3221:若所述语义识别模型接收所述标识语句集合中的标识信息,激活空白归置模块,其中,所述空白归置模块嵌于所述语义识别模型中,用于对语义结构元的某一分支进行空白归置;
步骤S3222:以所述空白归置模块为语义结构元生成的逻辑执行模块,生成所述标识语义结构元集合,其中,所述标识语义结构元集合中的每个语义结构元均包括一个空白语义元分支。
具体而言,将所述标识语句集合、所述不存在缺陷的语句集合与所述转换语句集合输入所述语义识别模型中,当接收到所述标识语句集合中的标识信息时,即语句中的缺陷标识部分,一般为不影响语句结构识别判定的代词,随着所述标识信息的识别同步激活所述空白归置模块,所述空白归置模块内嵌于所述语义识别模型中,用于对语义结构元的某一分支进行空白归置,示例性的,所述空白归置模块用于对存在缺陷小的语句,例如,用他进行宾语代替的描述,可以将对应的语义结构元下分支归为空白,也就是说,小的缺陷不碍事,不用进行语义转换,进一步的,将所述空白归置模块作为语义结构元生成的逻辑执行模块,对接收的所述标识语句集合分别进行结构识别于空白归置,将语句转换为上下左右中的结构元模式,生成所述标识语义结构元集合,所述标识语义结构元集合中每个语义结构元均包括一个空白语义元分支,所述空白语义元分支无特殊指代意义,为语义结构元的必要结构,通过对所述标识语句集合进行标识信息的空白归置,减少进行语义转换的信息量,同时可保障语义结构元的结构完整度。
进一步而言,如图3所示,根据所述语义结构元集合,以每个语义元为节点搭建事件分类树,本申请步骤S600还包括:
步骤S610:通过对所述语义结构元集合中的每个语义元进行中心节点的信息分析,获取中心节点事件信息;
步骤S620:根据所述中心节点事件信息对所述语义结构元集合进行遍历,获取遍历状态;
步骤S630:当遍历状态为遍历结束时,生成所述事件分类树。
具体而言,通过对所述待输入事件信息进行语句结构识别与表现模式转换,生成所述语义结构元集合,所述语义结构元集合中每个语义结构元均包括上下左右节点与中心节点,上下左右节点分别代表主语、宾语、进度、状态,中心节点为事件主体,对每个语义结构元对应的中心节点分别进行信息分析,确定中心节点对应的主体事件信息,基于所述中心节点事件信息遍历所述语义结构元,确定各语义结构元对应的中心节点事件之间的关联关系,确定相邻中心节点事件对应的语义结构元是否属于同级节点,获取所述遍历状态,即遍历进程,当所述遍历状态为遍历结束时,对所述语义结构元中涵盖的所有语义结构元进行关联分析与节点级别判定,生成所述事件分类树。
进一步而言,根据所述中心节点事件信息对所述语义结构元集合进行遍历,本申请步骤S620还包括:
步骤S621-1:当下一中心节点事件信息与上一中心节点事件信息相同时,将下一中心节点事件信息对应的语义元作为新增节点添加至所述上一中心节点事件信息对应所在分支的子分支,以此类推,直至所述语义结构元集合遍历结束。
进一步而言,根据所述元节点事件信息对所述语义结构元集合进行遍历,本申请步骤S620还包括:
步骤S621-2:当下一中心节点事件信息与上一中心节点事件信息不相同时,将下一中心节点事件信息对应的语义元作为所述事件分类树的新增子分支,以此类推,直至所述语义结构元集合遍历结束。
具体而言,对所述语义结构元集合基于所述中心节点事件信息进行遍历,对遍历进程中的相邻中心节点事件进行关联分析,当下一中心节点事件信息与上一中心节点事件信息相同时,表明对应的语义结构元属于同一主体事件,进一步的,进行语义结构元的涵盖信息比对分析,确定信息概括度较高的语义结构元级别较高,为上级分支节点,基于信息概括度较低的语义结构元在所述上级分支节点的基础上新增子分支,将其作为子分支节点;当下一中心节点事件信息与上一中心节点事件信息不同时,表明对应的语义结构元属于不同主体事件,将其作为同级别分支节点,因而将下一中心节点事件信息对应的语义元作为所述事件分类树的新增子分支,进行事件分类树扩充,基于上述构建规则遍历所述语义结构元集合,并同步进行所述事件分类树的构建,当所述语义结构元遍历结束时,所述事件分类树构建完成,通过进行中心节点事件信息的比对分析,可保障生成的所述事件分类树的结构条理性与准确性。
实施例二
基于与前述实施例中一种基于事件分类模型的概念抽象方法相同的发明构思,如图4所示,本申请提供了一种基于事件分类模型的概念抽象系统,所述系统包括:
信息获取模块11,所述信息获取模块11用于连接信息获取系统,获取待输入事件信息;
缺陷检测模块12,所述缺陷检测模块12用于将所述待输入事件信息输入信息缺陷检测模型中,根据所述缺陷检测模型,获取缺陷检测结果;
语句分类模块13,所述语句分类模块13用于基于所述缺陷检测结果,对所述待输入事件信息中的所有语句进行分类,获取存在缺陷的语句集合和不存在缺陷的语句集合;
语句转换模块14,所述语句转换模块14用于将所述存在缺陷的语句集合进行语句转换,获取转换语句集合;
语义识别模块15,所述语义识别模块15用于连接语义识别模型,将所述不存在缺陷的语句集合和所述转换语句集合输入所述语义识别模型中,根据所述语义识别模型,输出语义结构元集合,其中,所述语义结构元集合的数量与所述待输入事件信息的所有语句数量相同;
分类树搭建模块16,所述分类树搭建模块16用于根据所述语义结构元集合,以每个语义元为节点搭建事件分类树;
结果输出模块17,所述结果输出模块17用于以所述事件分类树的一级叶节点作为所述事件分类模型的输出结果。
进一步而言,所述系统还包括:
指标获取模块,所述指标获取模块用于根据所述缺陷检测结果对所述存在缺陷的语句集合进行缺陷度检测,获取缺陷检测指标,其中,所述缺陷检测指标用于标识各个语句中存在缺陷的大小;
指标判断模块,所述指标判断模块用于根据所述缺陷检测指标与预设缺陷检测指标进行判断,得到大于所述预设缺陷检测指标的语句集合;
待转换语句确定模块,所述待转换语句确定模块用于将大于所述缺陷检测指标的语句集合作为待转换语句集合。
进一步而言,所述系统还包括:
标识语句输出模块,所述标识语句输出模块用于将小于等于所述缺陷检测指标的语句集合作为标识语句集合输出;
语句输入模块,所述语句输入模块用于将所述标识语句集合、所述不存在缺陷的语句集合和所述转换语句集合输入所述语义识别模型中;
结构元输出模块,所述结构元输出模块用于根据所述语义识别模型,输出所述语义结构元集合,包括标识语义结构元集合、正常语义结构元集合和转换语义结构元集合。
进一步而言,所述系统还包括:
空白归置模块激活模块,所述空白归置模块激活模块用于若所述语义识别模型接收所述标识语句集合中的标识信息,激活空白归置模块,其中,所述空白归置模块嵌于所述语义识别模型中,用于对语义结构元的某一分支进行空白归置;
结构元生成模块,所述结构元生成模块用于以所述空白归置模块为语义结构元生成的逻辑执行模块,生成所述标识语义结构元集合,其中,所述标识语义结构元集合中的每个语义结构元均包括一个空白语义元分支。
进一步而言,所述系统还包括:
节点分析模块,所述节点分析模块用于通过对所述语义结构元集合中的每个语义元进行中心节点的信息分析,获取中心节点事件信息;
状态获取模块,所述状态获取模块用于根据所述中心节点事件信息对所述语义结构元集合进行遍历,获取遍历状态;
事件分类树生成模块,所述事件分类树生成模块用于当遍历状态为遍历结束时,生成所述事件分类树。
进一步而言,所述系统还包括:
子分支添加模块,所述子分支添加模块用于当下一中心节点事件信息与上一中心节点事件信息相同时,将下一中心节点事件信息对应的语义元作为新增节点添加至所述上一中心节点事件信息对应所在分支的子分支,以此类推,直至所述语义结构元集合遍历结束。
进一步而言,所述系统还包括:
子分支新增模块,所述子分支新增模块用于当下一中心节点事件信息与上一中心节点事件信息不相同时,将下一中心节点事件信息对应的语义元作为所述事件分类树的新增子分支,以此类推,直至所述语义结构元集合遍历结束。
本说明书通过前述对一种基于事件分类模型的概念抽象方法的详细描述,本领域技术人员可以清楚的知道本实施例中一种基于事件分类模型的概念抽象系统及方法,对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (5)

1.一种基于事件分类模型的概念抽象系统,其特征在于,所述系统包括:
信息获取模块,所述信息获取模块用于连接信息获取系统,获取待输入事件信息;
缺陷检测模块,所述缺陷检测模块用于将所述待输入事件信息输入缺陷检测模型中,根据所述缺陷检测模型,获取缺陷检测结果;
语句分类模块,所述语句分类模块用于基于所述缺陷检测结果,对所述待输入事件信息中的所有语句进行分类,获取存在缺陷的语句集合和不存在缺陷的语句集合;
语句转换模块,所述语句转换模块用于将所述存在缺陷的语句集合进行语句转换,获取转换语句集合;
语义识别模块,所述语义识别模块用于连接语义识别模型,将所述不存在缺陷的语句集合和所述转换语句集合输入所述语义识别模型中,根据所述语义识别模型,输出语义结构元集合,其中,所述语义结构元的数量与所述待输入事件信息的所有语句数量相同;
分类树搭建模块,所述分类树搭建模块用于根据所述语义结构元集合,以每个语义元为节点搭建事件分类树,每个语义结构元均包括上下左右节点与中心节点,上下左右节点分别代表主语、宾语、进度、状态,中心节点为事件主体;
结果输出模块,所述结果输出模块用于以所述事件分类树的一级叶节点作为所述事件分类模型的输出结果;
所述分类树搭建模块,包括:
节点分析模块,所述节点分析模块用于通过对所述语义结构元集合中的每个语义元进行中心节点的信息分析,获取中心节点事件信息;
状态获取模块,所述状态获取模块用于根据所述中心节点事件信息对所述语义结构元集合进行遍历,获取遍历状态;
事件分类树生成模块,所述事件分类树生成模块用于当遍历状态为遍历结束时,生成所述事件分类树;
所述状态获取模块,包括:
子分支添加模块,所述子分支添加模块用于当下一中心节点事件信息与上一中心节点事件信息相同时,将下一中心节点事件信息对应的语义元作为新增节点添加至所述上一中心节点事件信息对应所在分支的子分支,以此类推,直至所述语义结构元集合遍历结束;
子分支新增模块,所述子分支新增模块用于当下一中心节点事件信息与上一中心节点事件信息不相同时,将下一中心节点事件信息对应的语义元作为所述事件分类树的新增子分支,以此类推,直至所述语义结构元集合遍历结束。
2.如权利要求1所述的系统,其特征在于,所述语句分类模块,包括:
指标获取模块,所述指标获取模块用于根据所述缺陷检测结果对所述存在缺陷的语句集合进行缺陷度检测,获取缺陷检测指标,其中,所述缺陷检测指标用于标识各个语句中存在缺陷的大小;
指标判断模块,所述指标判断模块用于根据所述缺陷检测指标与预设缺陷检测指标进行判断,得到大于所述预设缺陷检测指标的语句集合;
待转换语句确定模块,所述待转换语句确定模块用于将大于所述预设缺陷检测指标的语句集合作为待转换语句集合。
3.如权利要求2所述的系统,其特征在于,所述指标判断模块,包括:
标识语句输出模块,所述标识语句输出模块用于将小于等于所述预设缺陷检测指标的语句集合作为标识语句集合输出;
语句输入模块,所述语句输入模块用于将所述标识语句集合、所述不存在缺陷的语句集合和所述转换语句集合输入所述语义识别模型中;
结构元输出模块,所述结构元输出模块用于根据所述语义识别模型,输出所述语义结构元集合,包括标识语义结构元集合、正常语义结构元集合和转换语义结构元集合。
4.如权利要求3所述的系统,其特征在于,所述语义识别模块,包括:
空白归置模块激活模块,所述空白归置模块激活模块用于若所述语义识别模型接收所述标识语句集合中的标识信息,激活空白归置模块,其中,所述空白归置模块嵌于所述语义识别模型中,用于对语义结构元的某一分支进行空白归置;
结构元生成模块,所述结构元生成模块用于以所述空白归置模块为语义结构元生成的逻辑执行模块,生成所述标识语义结构元集合,其中,所述标识语义结构元集合中的每个语义结构元均包括一个空白语义元分支。
5.一种基于事件分类模型的概念抽象方法,其特征在于,所述方法包括:
连接信息获取系统,获取待输入事件信息;
将所述待输入事件信息输入缺陷检测模型中,根据所述缺陷检测模型,获取缺陷检测结果;
基于所述缺陷检测结果,对所述待输入事件信息中的所有语句进行分类,获取存在缺陷的语句集合和不存在缺陷的语句集合;
将所述存在缺陷的语句集合进行语句转换,获取转换语句集合;
连接语义识别模型,将所述不存在缺陷的语句集合和所述转换语句集合输入所述语义识别模型中,根据所述语义识别模型,输出语义结构元集合,其中,所述语义结构元的数量与所述待输入事件信息的所有语句数量相同;
根据所述语义结构元集合,以每个语义元为节点搭建事件分类树,每个语义结构元均包括上下左右节点与中心节点,上下左右节点分别代表主语、宾语、进度、状态,中心节点为事件主体;
以所述事件分类树的一级叶节点作为所述事件分类模型的输出结果;
所述搭建事件分类树,包括:
对所述语义结构元集合中的每个语义元进行中心节点的信息分析,获取中心节点事件信息;
根据所述中心节点事件信息对所述语义结构元集合进行遍历,获取遍历状态;
当遍历状态为遍历结束时,生成所述事件分类树;
当下一中心节点事件信息与上一中心节点事件信息相同时,将下一中心节点事件信息对应的语义元作为新增节点添加至所述上一中心节点事件信息对应所在分支的子分支,以此类推,直至所述语义结构元集合遍历结束;
当下一中心节点事件信息与上一中心节点事件信息不相同时,将下一中心节点事件信息对应的语义元作为所述事件分类树的新增子分支,以此类推,直至所述语义结构元集合遍历结束。
CN202310264026.6A 2023-03-02 2023-03-02 一种基于事件分类模型的概念抽象系统及方法 Active CN116011461B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310264026.6A CN116011461B (zh) 2023-03-02 2023-03-02 一种基于事件分类模型的概念抽象系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310264026.6A CN116011461B (zh) 2023-03-02 2023-03-02 一种基于事件分类模型的概念抽象系统及方法

Publications (2)

Publication Number Publication Date
CN116011461A CN116011461A (zh) 2023-04-25
CN116011461B true CN116011461B (zh) 2023-07-21

Family

ID=86019559

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310264026.6A Active CN116011461B (zh) 2023-03-02 2023-03-02 一种基于事件分类模型的概念抽象系统及方法

Country Status (1)

Country Link
CN (1) CN116011461B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110377738A (zh) * 2019-07-15 2019-10-25 昆明理工大学 融合依存句法信息和卷积神经网络的越南语新闻事件检测方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9659005B2 (en) * 2014-05-16 2017-05-23 Semantix Technologies Corporation System for semantic interpretation
CN113705207A (zh) * 2021-03-16 2021-11-26 腾讯科技(深圳)有限公司 语法错误识别方法及装置
US11893345B2 (en) * 2021-04-06 2024-02-06 Adobe, Inc. Inducing rich interaction structures between words for document-level event argument extraction
CN114065770B (zh) * 2022-01-17 2022-04-15 江苏联著实业股份有限公司 一种基于图神经网络构建语义知识库的方法及系统
CN115422948B (zh) * 2022-11-04 2023-01-24 文灵科技(北京)有限公司 一种基于语义分析的事件层次网络识别系统及方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110377738A (zh) * 2019-07-15 2019-10-25 昆明理工大学 融合依存句法信息和卷积神经网络的越南语新闻事件检测方法

Also Published As

Publication number Publication date
CN116011461A (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
CN109726120B (zh) 一种基于机器学习的软件缺陷确认方法
CN113191148B (zh) 一种基于半监督学习和聚类的轨道交通实体识别方法
CN106156083A (zh) 一种领域知识处理方法及装置
CN113987199B (zh) 一种规范自动解译的bim智能审图方法、系统和介质
CN111597328B (zh) 一种新事件主题提取方法
CN111274817A (zh) 一种基于自然语言处理技术的智能化软件成本度量方法
CN116400901B (zh) 一种Python代码自动生成方法及系统
CN113190220A (zh) Json文件差异化对比方法及装置
CN115661553A (zh) 一种基于bim的轨道交通构件分类方法、系统及设备
CN116029306A (zh) 一种限定域文科简答题自动评分方法
CN111061923B (zh) 一种基于图依赖规则和监督学习的图数据实体识别系统
CN116611071A (zh) 一种基于多模态的函数级漏洞检测的方法
CN116150757A (zh) 一种基于cnn-lstm多分类模型的智能合约未知漏洞检测方法
CN115146062A (zh) 融合专家推荐与文本聚类的智能事件分析方法和系统
CN116011461B (zh) 一种基于事件分类模型的概念抽象系统及方法
CN111738290B (zh) 图像检测方法、模型构建和训练方法、装置、设备和介质
CN117421226A (zh) 一种基于生成式大语言模型的缺陷报告重构的方法及系统
CN115759085A (zh) 基于提示模型的信息预测方法、装置、电子设备及介质
CN115982037A (zh) 一种基于抽象语法树的软件缺陷预测方法
CN114154572A (zh) 一种基于异构平台的异构数据集中接入分析方法
CN106997462A (zh) 一种量子线路图像识别方法
CN113326371A (zh) 一种融合预训练语言模型与抗噪声干扰远程监督信息的事件抽取方法
CN117435246B (zh) 一种基于马尔可夫链模型的代码克隆检测方法
CN117609005B (zh) 一种代码相似度检测方法
CN117010019B (zh) 一种基于nlp语言模型的数据脱敏方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant