CN114528848B - 一种基于指标阈值和语义解析的安全分析和自动评估方法 - Google Patents
一种基于指标阈值和语义解析的安全分析和自动评估方法 Download PDFInfo
- Publication number
- CN114528848B CN114528848B CN202210427347.9A CN202210427347A CN114528848B CN 114528848 B CN114528848 B CN 114528848B CN 202210427347 A CN202210427347 A CN 202210427347A CN 114528848 B CN114528848 B CN 114528848B
- Authority
- CN
- China
- Prior art keywords
- safety
- index
- semantic
- analysis
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 60
- 238000011156 evaluation Methods 0.000 title claims abstract description 48
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000004364 calculation method Methods 0.000 claims abstract description 11
- 230000000694 effects Effects 0.000 claims abstract description 11
- 238000012544 monitoring process Methods 0.000 claims abstract description 6
- 230000001105 regulatory effect Effects 0.000 claims abstract description 6
- 239000013598 vector Substances 0.000 claims description 33
- 230000011218 segmentation Effects 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 11
- 239000000463 material Substances 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 4
- 230000000692 anti-sense effect Effects 0.000 claims description 3
- 230000007613 environmental effect Effects 0.000 claims description 3
- 238000012512 characterization method Methods 0.000 claims description 2
- 230000007246 mechanism Effects 0.000 claims description 2
- 230000008520 organization Effects 0.000 claims 1
- 238000012549 training Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 2
- 238000007670 refining Methods 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
- G06Q50/265—Personal security, identity or safety
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Computational Linguistics (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Strategic Management (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Security & Cryptography (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Technology Law (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于指标阈值和语义解析的安全分析和自动评估方法。首先,从非结构化的安全分析报告、法规标准等安全分析原始语料中抽取语义关系,构建规范化的安全知识库;同时,按活动、事项等维度构建安全指标实体集,分类、分层划分安全指标集;基于语义相似度计算方法,从法规标准、技术要求、评判依据等语料中识别、抽取安全指标实体及阈值属性,能够从安全分析报告中识别、抽取安全指标实体和监测数据属性;根据语义解析结果,能够对安全指标满足情况自动对标与判定,并能够结合专家经验法对指标初判结果复核校验。该方法满足用户对不同活动、事项进行快速、准确、智能的安全分析和自动评估需求,能够有效提升安全评价效率和准确性。
Description
技术领域
本发明属于安全监管领域,尤其涉及一种基于指标阈值和语义解析的安全分析和自动评估方法,适用于某类任务活动或任务事项的安全评估。
背景技术
对于安全监管领域的任务活动或任务事项,在已开展的安全评估工作中,通常采用文件审查方法,由审查专家对照相关安全法律法规和技术标准,结合专家经验,查找安全问题,并通过现场见证和现场测量等方法进一步核实相关问题,随着越来越多的安全评估任务输入以及安全评估相关资料和数据资源的日渐积累、更新,如何建立更加科学有效的分析评价能力,解决传统安全评估方法的资料利用率低、分析手段自动化程度不高、信息挖掘不充分的问题,成为当前安全监管领域的重点研究内容。
文本作为安全评估信息最重要的载体,从非结构化的安全文本语料中快速、准确地自动解析、抽取关键信息是文件审查的关键部分。目前,分词、实体识别、实体语义关系分类、文本相似度计算等技术是语义分析领域的主要研究方向,在各类型自然语言处理任务中得到了广泛的应用。现有的文件审查方法存在专家经验依赖度过高、信息挖掘不充分、资料利用率低、分析手段自动化程度不足的缺陷愈发明显。
发明内容
发明目的:本发明的目的在于提供一种基于指标阈值和语义解析的安全分析和自动评估方法,能够有效辅助安全审评专家对某类任务活动或任务事项的安全对标审查、安全综合评价等安全评估提供技术支持。
技术方案:本发明的基于指标阈值和语义解析的安全分析和自动评估方法,包括如下步骤:
步骤1,安全指标实体构建:根据不同活动、事项的事故致因理论,结合评估要求,确定评估因素及层次,所述评估要求包括安全法规标准、技术要求和评判依据;抽取关键名词构建安全指标目录,定义安全指标实体及属性;
步骤2、语义关系抽取:根据不同活动、事项的安全评估场景需要,对原始语料中语义关系进行定义、分类,并规范化原始语料中文本的命名、定义以及内容描述,构建形成安全分析知识库,所述原始语料中语义关系包括安全分析报告、报告模板和法规标准;
步骤3、安全指标实体及属性抽取:以安全指标为目标实体模板,结合安全分析语义关系集,利用语义文本相似度计算方法在安全分析报告中进行匹配,抽取安全指标实体、属性及属性值,所述安全指标实体包括安全分析报告中人员、装备、物资器材、技术文档、使用环境和组织机构;在法规标准、技术要求、评判依据的语料中匹配进行匹配,抽取安全指标实体及阈值属性;
步骤4、自动评估:自动对指标阈值与分析报告属性值进行匹配、判断,区分定量指标、定性指标设置评语集,给出安全自动对标评估结果。
进一步地,步骤1中,所述安全指标实体构建具体步骤如下:
步骤1-1、结合典型安全评估任务需求,采用层次分析法建立安全评价指标体系,按任务剖面划分第一层级指标,再按人员、装备、物资器材、技术文档、环境保障的方面进一步细分指标目录,将影响安全的复杂表征参数层次化、条理化,形成递阶层次分析模型;
步骤1-2、根据安全法规标准、技术要求、评判依据中的管理要求,规范化、标准化定义指标实体名称及属性名称,满足限定文本语料、限定语义单元类型实体匹配的完整性条件。
进一步地,步骤2中,所述语义关系抽取具体步骤如下:
步骤2-1、通过实体语义关系分类任务预先定义实体关系类别,包括同类、反义、上下义和整体与部分的关系;
步骤2-2、通过Jieba分词技术对安全分析报告、报告模板、法规标准的中文原始语料进行文本分词和词频统计,筛选出适用于安全评估领域专业词典词库;
步骤2-3:在实体关系分类的基础上,对安全分析报告中的词汇进行对比、组合、归纳,推定词汇语义关系。
进一步地,步骤3中,所述安全指标实体及属性抽取具体步骤如下:
步骤3-1、采用one-hot编码方法对安全分析报告的分词结果进行向量化,得到词向量;结合安全分析报告分句结果,进行句向量编码;
步骤3-2:以安全指标实体及属性为模板,通过语义文本相似度计算方法对词向量、句向量进行匹配计算,取相似度最大值;
步骤3-3:结合预定义的语义关系进行对安全指标及属性的匹配结果进行逻辑知识推理,抽取出与实体相关的属性值;
步骤3-4:将抽取得到的安全评估的实体、关系、实体和实体、属性、属性值通过三元组表达与存储,用来描述指标实体、阈值、监测值等信息。
进一步地,步骤4中,所述自动评估具体步骤如下:
步骤4-1:区分定性指标、定量指标类型设置评语集;
步骤4-2:根据不同任务、事项的安全评估场景要求,对标比对安全指标阈值、安全指标监测值信息,自动生成指标满足情况评语。
有益效果:与现有技术相比,本发明具有如下显著优点:
(1)本发明充分挖掘大量非结构化的安全评估历史档案、安全分析报告、安全检查报告、安全监测数据、法规标准、规章制度等资源信息,以可理解、可表达、可利用的形式进行安全知识管理,构建规范化的安全知识库,支撑实现从主观经验向技术手段的转变;
(2)本发明通过实体识别与语义解析方法,实现安全分析报告中安全指标及属性等关键信息的自动提取;
(3)本发明能够根据预定义的评语集,结合语义解析结果,自动对不同安全任务、事项的安全指标进行对标评估。
附图说明
图1是基于指标阈值设置和语义解析的安全分析和自动评估方法的流程示意图;
图2是安全指标实体构建的过程示意图;
图3是安全指标实体及属性抽取的过程示意图。
具体实施方式
下面结合附图对本发明的技术方案作进一步说明。
实施例
一、安全指标实体构建
安全指标实体库是语义解析的基础,实体库包含的指标越丰富、越准确,分词算法切分的准确率越高。本发明根据不同安全活动、安全事项的事故致因理论,结合安全法规标准、技术要求、评判依据等评估要求,通过层次分析法分级、分类构建指标实体库,对安全指标实体及属性进行定义,流程如图2所示,具体步骤如下:
a)选取安全法规标准、技术要求、评判依据、审评大纲、安全分析报告等文档,作为确定指标实体的语料库;
b)从语料库中,根据专家经验法初步识别出与安全评估流程相关的人、机、料、法、环五方面关键因素,对各项因素经规范化、标准化处理后,初始化定义指标实体及属性;
c)通过Jieba分词技术对安全分析报告、报告模板、法规标准等中文原始语料进行文本分词、词频统计、数据清洗,筛选出指标实体候选集;
d)结合专家经验,根据指标实体候选集或业务需求,对指标实体及属性进行补充和更新;
e)采用层次分析法对指标实体进行分级、分类,首先,按照任务剖面划分第一层级指标,按照人员、装备、物资器材、技术文档、环境保障等方面细化指标,还可进一步细化为指数层指标实体、指标层指数实体;直至完成所有指标实体层级关系的构建。
二、语义关系抽取
由于安全评估领域的文档具有组合词较多、专业词汇复杂的特点,传统的基于关联规则的语义关系抽取方法不具有领域针对性,对安全评估领域文档的词语训练效果较差。本发明通过分析安全评估领域的特点,采用一种基于改进词向量的语义关系抽取方法,流程如所示,其语义关系抽取具体步骤如下:
a)采用one-hot编码方法对语料库中的安全评估相关文本进行分词处理,完成词向量的初始化,构建形成词语矩阵;
其中, c表示目标词w的上下文, e为目标词 w的词向量;
c)连续词袋训练模型根据目标词w上下文的表示,通过公式对目标词进行预测,其中exp函数是计算自然
对数的LN函数的反函数, w表示目标词,c表示目标词 w的上下文,e为目标词 w的词向量,是 e向量的转置,是 w向量的转置;
d)完成整个语料库的模型训练。
在词向量初始化前,关于词向量优化的具体步骤如下:
a)对语料库的相关语义关系进行分类,包括同类(即相似)、反义、上下义和整体与部分的关系;
b)强化正样本,考虑到每个词语受同一句中的词语影响较大,受不同句中的词语影响较小,对词语进行训练的时候,选取包含词语所在句子为原则,进行语料筛选,而不是直接使用原语料库全集进行训练;
c)语料扩充,选中包含目标词所有的将具有同类(相似)关系的上下文,进行语料扩充,例如“气压测量仪”和“气压测量设备”;
e)选取上下文长度为的词语,选取中心词的组合
词进行预处理,得到的上下文词语,…,,…,,…,,…,,…,,将与的训练语料进
行合并,更新目标词 的上下文表示:,模型输
入更新为,e为目标词 w的词向量。
通过语义关系抽取步骤,能够学习得到适用于安全评估领域的、以目标词为中心展开的语义关系模式。
三、安全指标实体及属性抽取
以安全指标及属性作为目标词,定义相似度机制来评价目标词和文档在语义关系上的匹配距离,如果两个词语具有相似关系,则两个词语的词向量在同维度上的分量会具有相似关系,语义相似度数值越大,某一维度的向量差就会比较小,分量和会比较大;反之,语义差异性越大的两个词语,相似度数值越小。
向量差特征定义:
向量和特征定义:
向量乘特征定义:
向量连接特征定义:
采用基于监督学习方法计算安全指标实体与安全分析报告的语义文本相似度,具体过程如下:
a)输入层:将安全分析报告文本中的句子进行分词,结合安全指标实体库中的词语来匹配句子,将匹配的词语映射为词向量输入编码层,词向量的初始化及优化过程见语义关系抽取步骤;
b)编码层:根据安全分析报告中的分句情况,对句中的词向量进行编码得到句向量;
c)匹配层:对句向量进行相似度计算,通过向量距离余弦相似度标准语义相似性,计算公式为
四、自动评估
将步骤3中得到的安全指标阈值信息与分析报告中的安全指标实体属性值自动进行匹配、判断,并给出对标评价结果,具体步骤如下:
d)对指标评估结果进行汇总、统计,生成评估结果汇总文件。
Claims (5)
1.一种基于指标阈值和语义解析的安全分析和自动评估方法,其特征在于,包括如下步骤:
步骤1,安全指标实体构建:根据不同活动、事项的事故致因理论,结合评估要求,确定评估因素及层次,所述评估要求包括安全法规标准、技术要求和评判依据;抽取关键名词构建安全指标目录,定义安全指标实体及属性;
步骤2、语义关系抽取:根据不同活动、事项的安全评估场景需要,对原始语料中语义关系进行定义、分类,并规范化原始语料中文本的命名、定义以及内容描述,构建形成安全分析知识库,所述原始语料中语义关系包括安全分析报告、报告模板和法规标准;
步骤3、安全指标实体及属性抽取:以安全指标为目标实体模板,结合安全分析语义关系集,利用语义文本相似度计算方法在安全分析报告中进行匹配,抽取安全指标实体、属性及属性值,所述安全指标实体包括安全分析报告中人员、装备、物资器材、技术文档、使用环境和组织机构;在法规标准、技术要求、评判依据的语料中匹配进行匹配,抽取安全指标实体及阈值属性;
步骤4、自动评估:自动对指标阈值与分析报告属性值进行匹配、判断,区分定量指标、定性指标,设置评语集,给出安全自动对标评估结果。
2.根据权利要求1所述的基于指标阈值和语义解析的安全分析和自动评估方法,其特征在于,步骤1中,所述安全指标实体构建具体步骤如下:
步骤1-1、结合典型安全评估任务需求,采用层次分析法建立安全评价指标体系,按任务剖面划分第一层级指标,再按人员、装备、物资器材、技术文档、环境保障的方面进一步细分指标目录,将影响安全的复杂表征参数层次化、条理化,形成递阶层次分析模型;
步骤1-2、根据安全法规标准、技术要求、评判依据中的管理要求,规范化、标准化定义指标实体名称及属性名称,满足限定文本语料、限定语义单元类型实体匹配的完整性条件。
3.根据权利要求1所述的基于指标阈值和语义解析的安全分析和自动评估方法,其特征在于,步骤2中,所述语义关系抽取具体步骤如下:
步骤2-1、通过实体语义关系分类任务来预先定义实体关系类别,包括同类、反义、上下义和整体与部分的关系;
步骤2-2、通过Jieba分词技术对安全分析报告、报告模板、法规标准的中文原始语料进行文本分词和词频统计,筛选出适用于安全评估领域专业词典词库;
步骤2-3:在实体关系分类的基础上,对安全分析报告中的词汇进行对比、组合、归纳,推定词汇语义关系。
4.根据权利要求1所述的基于指标阈值和语义解析的安全分析和自动评估方法,其特征在于,步骤3中,所述安全指标实体及属性抽取具体步骤如下:
步骤3-1、采用one-hot编码方法对安全分析报告的分词结果进行向量化,得到词向量;结合安全分析报告分句结果,进行句向量编码;
步骤3-2:以安全指标实体及属性为模板,通过语义文本相似度计算方法对词向量、句向量进行匹配计算,取相似度最大值;
步骤3-3:结合预定义的语义关系对安全指标及属性的匹配结果进行逻辑知识推理,抽取出与实体相关的属性值;
步骤3-4:将抽取得到的安全评估的实体、关系、实体和实体、属性、属性值通过三元组表达与存储,用来描述指标实体、阈值、监测值的信息。
5.根据权利要求1所述的基于指标阈值和语义解析的安全分析和自动评估方法,其特征在于,步骤4中,所述自动评估具体步骤如下:
步骤4-1:区分定量指标、定性指标,设置评语集;
步骤4-2:根据不同任务、事项的安全评估场景要求,对标比对安全指标阈值、安全指标监测值信息,自动生成指标满足情况评语。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210427347.9A CN114528848B (zh) | 2022-04-22 | 2022-04-22 | 一种基于指标阈值和语义解析的安全分析和自动评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210427347.9A CN114528848B (zh) | 2022-04-22 | 2022-04-22 | 一种基于指标阈值和语义解析的安全分析和自动评估方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114528848A CN114528848A (zh) | 2022-05-24 |
CN114528848B true CN114528848B (zh) | 2022-07-26 |
Family
ID=81628267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210427347.9A Active CN114528848B (zh) | 2022-04-22 | 2022-04-22 | 一种基于指标阈值和语义解析的安全分析和自动评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114528848B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115619090B (zh) * | 2022-10-08 | 2023-06-23 | 中国电子科技集团公司第二十八研究所 | 一种基于模型和数据驱动的安全评估方法 |
CN116579633B (zh) * | 2023-07-12 | 2023-11-17 | 湖南省计量检测研究院 | 基于数据驱动实现风电设备的服役状态质量分析方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111401782A (zh) * | 2020-04-03 | 2020-07-10 | 水利部交通运输部国家能源局南京水利科学研究院 | 一种跨省江河水量调度管理评估指标体系的方法 |
CN113761128A (zh) * | 2021-07-26 | 2021-12-07 | 中国传媒大学 | 领域同义词典与模式匹配相结合的事件关键信息抽取方法 |
CN113591465B (zh) * | 2021-07-30 | 2023-05-09 | 四川大学 | 基于关联增强的网络威胁情报多维IoC实体识别方法及装置 |
-
2022
- 2022-04-22 CN CN202210427347.9A patent/CN114528848B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN114528848A (zh) | 2022-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110413780B (zh) | 文本情感分析方法和电子设备 | |
KR102020756B1 (ko) | 머신러닝을 이용한 리뷰 분석 방법 | |
US10089581B2 (en) | Data driven classification and data quality checking system | |
CN114528848B (zh) | 一种基于指标阈值和语义解析的安全分析和自动评估方法 | |
CN109471942B (zh) | 基于证据推理规则的中文评论情感分类方法及装置 | |
CN107491531A (zh) | 基于集成学习框架的中文网络评论情感分类方法 | |
KR102019207B1 (ko) | 텍스트 분석을 위한 데이터 품질 평가 장치 및 방법 | |
CN109657947A (zh) | 一种面向企业行业分类的异常检测方法 | |
US10083403B2 (en) | Data driven classification and data quality checking method | |
CN111158641B (zh) | 基于语义分析和文本挖掘的事务类功能点自动识别方法 | |
Kaur | Incorporating sentimental analysis into development of a hybrid classification model: A comprehensive study | |
CN113420145A (zh) | 一种基于半监督学习的招标文本分类方法与系统 | |
CN115062148A (zh) | 一种基于数据库的风险控制方法 | |
CN112347271A (zh) | 基于文字语义识别的配电物联网设备缺陷辅助录入方法 | |
CN115292518A (zh) | 基于知识型信息抽取的配电网故障处理方法及系统 | |
CN112685374B (zh) | 日志分类方法、装置及电子设备 | |
CN114997169A (zh) | 一种实体词识别方法、装置、电子设备及可读存储介质 | |
CN114997288A (zh) | 一种设计资源关联方法 | |
Hase | Automated content analysis | |
CN115859980A (zh) | 一种半监督式命名实体识别方法、系统及电子设备 | |
CN114265935A (zh) | 一种基于文本挖掘的科技项目立项管理辅助决策方法及系统 | |
CN114491034B (zh) | 一种文本分类方法及智能设备 | |
CN115146062A (zh) | 融合专家推荐与文本聚类的智能事件分析方法和系统 | |
CN114841658A (zh) | 一种基于分类的专项施工方案强制性条文合规性审查方法 | |
CN112579730A (zh) | 高扩展性、多标签的文本分类方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |