CN116090416B - 基于标准知识图谱的标准编写方法、系统、设备及介质 - Google Patents

基于标准知识图谱的标准编写方法、系统、设备及介质 Download PDF

Info

Publication number
CN116090416B
CN116090416B CN202310373909.0A CN202310373909A CN116090416B CN 116090416 B CN116090416 B CN 116090416B CN 202310373909 A CN202310373909 A CN 202310373909A CN 116090416 B CN116090416 B CN 116090416B
Authority
CN
China
Prior art keywords
standard
writing
index
template
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310373909.0A
Other languages
English (en)
Other versions
CN116090416A (zh
Inventor
崔静
王立玺
吕千千
祝贺
牛艳茹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING SAIXI TECHNOLOGY DEVELOPMENT CO LTD
China Electronics Standardization Institute
Original Assignee
BEIJING SAIXI TECHNOLOGY DEVELOPMENT CO LTD
China Electronics Standardization Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING SAIXI TECHNOLOGY DEVELOPMENT CO LTD, China Electronics Standardization Institute filed Critical BEIJING SAIXI TECHNOLOGY DEVELOPMENT CO LTD
Priority to CN202310373909.0A priority Critical patent/CN116090416B/zh
Publication of CN116090416A publication Critical patent/CN116090416A/zh
Application granted granted Critical
Publication of CN116090416B publication Critical patent/CN116090416B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Evolutionary Computation (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开一种基于标准知识图谱的标准编写方法、系统、设备及介质,涉及标准知识图谱技术领域,该方法包括:根据用户的标准编写需求,从标准数据库中筛选出相应的初始标准模板,以及自动生成相应的特定标准模板;根据标准编写过程中用户输入的编写内容,从标准数据库中筛选出与编写内容相关的标准条款;从标准数据库中筛选出与编写内容的主题相关的标准文本,并从标准文本中提取出标准文摘;将初始标准模板、特定标准模板、标准条款和标准文摘推送给用户,使得用户利用推送内容进行标准编写。实现标准编写过程智能化,为用户提供基于结构化标准数据的标准编写支撑,帮助用户便捷获取所需标准及相关内容,提升标准编写效率。

Description

基于标准知识图谱的标准编写方法、系统、设备及介质
技术领域
本发明涉及标准知识图谱技术领域,尤其涉及一种基于标准知识图谱的标准编写方法、系统、设备及介质。
背景技术
标准编写是一种特定形式的技术文件。目前标准编写主要存在两方面问题。一方面,标准编写需要开发支撑方法和装置。具体而言,标准制定、修订的门槛较高,专业技术人员培养需要一定的时间,缺少优质参考资料,亟需建成标准辅助编写工具,辅助标准起草人员编排文档格式,使得起草人员能够将精力集中在标准内容的编写上,促进标准编写质量的提升。另一方面,标准编写方法和装置开发需结合知识图谱技术。具体而言,传统标准编写方法仅支持提供固定的标准编写模板,无法充分结合用户需求开展智能化标准模板推荐设计、主题内容推荐和自动文摘生成,导致编写效率低下。
随着标准全文结构化数据库的构建和标准知识图谱技术的发展,如何运用标准知识图谱技术挖掘标准间的关联关系,进而基于标准间关联关系建成基于标准知识图谱的标准编写方法和装置,对提升标准编写质量和标准编写效率具有重要意义。
发明内容
有鉴于此,本发明提供一种基于标准知识图谱的标准编写方法、系统、设备及介质,至少部分解决现有技术中存在的问题。
为解决上述问题,按照本发明的一个方面,提供了一种基于标准知识图谱的标准编写方法,包括:
步骤S1,根据用户的标准编写需求,从标准数据库中筛选出相应的初始标准模板,以及自动生成相应的特定标准模板;
步骤S2,根据标准编写过程中用户输入的编写内容,从所述标准数据库中筛选出与所述编写内容相关的标准条款;
步骤S3,从所述标准数据库中筛选出与所述编写内容的主题相关的标准文本,并从所述标准文本中提取出标准文摘;
步骤S4,将所述初始标准模板、所述特定标准模板、所述标准条款和所述标准文摘推送给用户,使得用户利用所述初始标准模板、所述特定标准模板、所述标准条款和所述标准文摘进行标准编写。
优选地,所述步骤S1包括:根据所述标准编写需求对应的标准类型,从所述标准数据库中筛选出匹配的第一标准模板以组成定制数据库;根据所述标准编写需求中的用户需求信息,从所述定制数据库中筛选出匹配的第二标准模板以作为所述初始标准模板;获取用户对所述初始标准模板的编辑指令,根据所述标准编写需求、所述初始标准模板和所述编辑指令,自动生成所述特定标准模板。
优选地,所述方法还包括:根据所述标准编写需求对应的标准类型、以及所述编写内容中的标准化对象,从标准知识图谱中检索匹配的第一标准指标;将所述第一标准指标推送给用户,使得用户利用所述第一标准指标进行标准编写。
优选地,当所述标准知识图谱中存在与所述标准类型匹配的标准指标,且不存在与所述标准化对象匹配的标准指标时,所述第一标准指标为标准知识图谱中与所述标准类型匹配的标准指标。
优选地,当所述标准知识图谱中存在与所述标准化对象匹配的标准指标,且不存在与所述标准类型匹配的标准指标时,所述从标准知识图谱中检索匹配的第一标准指标包括:根据所述编写内容中的产品类别,从所述标准知识图谱中检索匹配的第二标准指标,其中,所述产品类别为所述标准化对象的下一层级;从所述第二标准指标中检索出与所述标准化对象匹配的第一标准指标。
优选地,所述步骤S2包括:提取所述编写内容的主题关键词;计算所述主题关键词与所述标准数据库中各标准条款之间的相似度,并从中选取出若干个最高相似度对应的标准条款。
优选地,方法还包括:获取用户编写的标准文档,并按照目标格式要求对所述标准文档进行格式转换。
按照本发明的另一个方面,提供了一种基于标准知识图谱的标准编写系统,包括:标准模板设计模块,用于根据用户的标准编写需求,从标准数据库中筛选出相应的初始标准模板,以及自动生成相应的特定标准模板;标准条款筛选模块,用于根据标准编写过程中用户输入的编写内容,从所述标准数据库中筛选出与所述编写内容相关的标准条款;标准文摘提取模块,用于从所述标准数据库中筛选出与所述编写内容的主题相关的标准文本,并从所述标准文本中提取出标准文摘;推送及编写模块,用于将所述初始标准模板、所述特定标准模板、所述标准条款和所述标准文摘推送给用户,使得用户利用所述初始标准模板、所述特定标准模板、所述标准条款和所述标准文摘进行标准编写。
按照本发明的另一个方面,提供了一种电子设备,包括:处理器;存储器,其存储有计算机可执行程序,所述程序在被所述处理器执行时,使得所述处理器执行如上所述的基于标准知识图谱的标准编写方法。
按照本发明的另一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上所述的基于标准知识图谱的标准编写方法。
总体而言,通过本发明所构思的以上技术方案,能够取得以下有益效果:通过运用标准知识图谱技术挖掘标准间的关联关系,进而基于标准间关联关系设计基于标准知识图谱的标准编写方法,实现标准编写过程智能化,为用户提供基于结构化标准数据的标准编写支撑,帮助用户便捷获取所需标准及相关内容,提升标准编写效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的基于标准知识图谱的标准编写方法的流程图;
图2为本发明实施例提供的标准知识图谱的示意图;
图3为本发明实施例提供的基于标准知识图谱的标准编写系统的框图;
图4为本发明实施例提供的电子设备的框图。
具体实施方式
下面结合附图对本发明实施例进行详细描述。
需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合;并且,基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本发明公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
图1为本发明实施例提供的基于标准知识图谱的标准编写方法的流程图。参阅图1,结合图2,对本实施例中基于标准知识图谱的标准编写方法进行详细说明,该方法包括步骤S1-步骤S4。
步骤S1,根据用户的标准编写需求,从标准数据库中筛选出相应的初始标准模板,以及自动生成相应的特定标准模板。
根据本发明的实施例,步骤S1包括子步骤S11-子步骤S13。
在子步骤S11中,根据标准编写需求对应的标准类型,从标准数据库中筛选出匹配的第一标准模板以组成定制数据库。
标准数据库是指标准全文结构化数据库,其内部存储有各种标准编写要求文件,是该基于标准知识图谱的标准编写方法使用的数据基础。标准数据库中的各文件被预先赋予了相关特征,相关特征例如包括标准类型、标准关键词等。标准类型例如包括指南、国家标准、行业标准、地方标准、企业标准等。
在子步骤S12中,根据标准编写需求中的用户需求信息,从定制数据库中筛选出匹配的第二标准模板以作为初始标准模板。
具体地,根据标准编写需求,检测和分析出用户需求信息,将用户需求信息和定制数据库中的第一标准模板进行匹配,自动筛选出与该用户需求信息匹配的第二标准模板,该第二标准模板即为初始标准模板。
在子步骤S13中,获取用户对初始标准模板的编辑指令,根据标准编写需求、初始标准模板和编辑指令,自动生成特定标准模板。具体地,例如采用基于Decoder结构的文本生成技术,根据标准编写需求、初始标准模板和编辑指令自动生成特定标准模板。
为了丰富和补充自动推荐的初始标准模板的不足,本实施例中,根据标准编写需求,综合自动推荐的多种初始标准模板,支持用户对自动推荐的模板进行编辑,从而自动生成新的标准模板(即特定标准模板)。
进一步地,导出子步骤S12中自动推荐的初始标准模板以及子步骤S13中自动生成的特定标准模板。
本实施例中,在标准编写过程中结合标准类型自动生成个性化标准模板(即特定标准模板),辅助编写标准草案;支持自定义标准模板数据库,标准研制人员可通过系统内相关领域标准的结构化数字资源,选择强相关章节条目,自动生成个性化标准模板,精准辅助标准研制人员编写标准草案。
步骤S2,根据标准编写过程中用户输入的编写内容,从标准数据库中筛选出与编写内容相关的标准条款。
根据本发明的实施例,步骤S2包括:提取编写内容的主题关键词;计算主题关键词与标准数据库中各标准条款之间的相似度,并从中选取出若干个最高相似度对应的标准条款。
具体地,获取用户在标准编写过程中输入的编写内容,分析该编写内容的主题,并通过语义分析抽取主题关键词;基于知识图谱的关联发现技术,运用Word2Vec算法,计算主题关键词与标准数据库中各标准条款之间的相似度;将相似度从高到低进行排序,从中选取出若干个最高相似度对应的标准条款。标准条款例如包括标准、章节和术语等。
步骤S3,从标准数据库中筛选出与编写内容的主题相关的标准文本,并从标准文本中提取出标准文摘。
具体地,从标准数据库中抽取出与编写内容的主题相关的标准文本,按照逻辑和框架对该标准文本进行有序组织,并从中提取出标准文摘。优选地,例如采用Text-Rank排序算法对该标准文本进行有序组织。
本实施例中,基于全文结构化数据库和自然语言处理技术,采用抽取式摘要方法,针对单一的目标标准生成标准文摘。包括从主题相关的标准中抽取关键句和关键词,采用固定摘要生成模板,组织生成标准文摘,文摘内容全部来源于标准数据库。
步骤S4,将初始标准模板、特定标准模板、标准条款和标准文摘推送给用户,使得用户利用初始标准模板、特定标准模板、标准条款和标准文摘进行标准编写。
本发明实施例中,构建的标准知识图谱如图2所示。图2所示的标准知识图谱中,指标是指某标准规范的所有技术指标;标准化对象包括产品、服务、过程等;产品类型是多层树形结构,同一产品类别下包含多个子产品或子产品类别。
根据本发明的实施例,该基于标准知识图谱的标准编写方法还包括:根据标准编写需求对应的标准类型以及编写内容中的标准化对象,从标准知识图谱中检索匹配的第一标准指标;将第一标准指标推送给用户,使得用户利用第一标准指标进行标准编写。具体地,根据上述标准类型以及标准化对象,检索标准知识图谱中已经存在的标准化对象及相同标准类型的标准,根据该标准所规定的条款,提供指标类型,作为标准编写过程的参考模板。
当标准知识图谱中同时存在与标准编写需求对应的标准类型匹配的标准指标、以及与编写内容中的标准化对象匹配的标准指标时,第一标准指标为标准知识图谱中与上述标准类型和标准化对象匹配的标准指标。
当标准知识图谱中存在与上述标准类型匹配的标准指标,且不存在与上述标准化对象匹配的标准指标时,第一标准指标为标准知识图谱中与上述标准类型匹配的标准指标。具体地,选取相同标准类型的标准,提供该标准规定的指标列表,从该指标列表中选取该标准化对象相关联的标准中规定的指标。
当标准知识图谱中存在与上述标准化对象匹配的标准指标,且不存在与上述标准类型匹配的标准指标时,从标准知识图谱中检索匹配的第一标准指标包括:根据编写内容中的产品类别,从标准知识图谱中检索匹配的第二标准指标,其中,产品类别为标准化对象的下一层级;从第二标准指标中检索出与上述标准化对象匹配的第一标准指标。优选地,采用Word2Vec相似度计算算法实现上述匹配操作。具体地,对产品类别进行检索,选择相同层级下的其他标准化对象,选取相同标准化对象对应的标准,提供该标准规定的指标列表。
本实施例中,可以实现范围的自动生成。具体的,选取同类型标准化对象的同类型标准的范围部分;利用Word2Vec算法计算该范围文字和标准化对象的相似程度;用编写标准的标准化对象替换原有的范围中,相似度最高的部分。
根据本发明的实施例,该方法还包括:获取用户编写的标准文档,并按照目标格式要求对标准文档进行格式转换。本实施例中,可以对单个标准文档进行一键格式转换,也可以对多个标准文档进行批量一键格式转换。
具体地,根据用户所写标准类型,选取库中已经存在的标准,读取该标准的结构和格式;根据标准的结构,对所编写的标准条款进行编号;根据标准的格式,对所编写的标准文本进行格式映射。相同层级的文字采用相同的字体、字号、行间距等。具体地,例如采用Word2Vec相似度计算算法选取库中与用户所写标准类型匹配的标准;采用CNN-BILSTM-CRF模型对所编写的标准文本进行抽取和格式映射。
本实施例中,对照标准编写规定,自动调整和统一标准格式。在模板中内置标准文件编写规定的各个要素的编辑样式,确保标准导出时标准格式均符合要求。包括封面格式、目次格式、前言格式、正文格式、字号字体和间距格式等。用户可将标准导出为标准数据文件或Word文件,导出后自动实现格式转换。
基于本发明实施例提供的方法,构建基于标准知识图谱的标准编写系统,系统例如包括14个标准编写功能组件以及3项系统管理组件。标准编写功能组件包括:编写新标准组件、编辑章节目录组件、标准/章节/术语推荐组件、手动编辑标准内容组件、插入图片组件、修改表题图题组件、标准基本信息修改组件、保存标准组件、记录标准从草案到报批稿状态组件、标准完成组件、标准导出组件、我的标准组件、我的模板组件、回收站组件。系统管理组件包括:用户管理组件、角色管理组件、版本管理组件。
编写新标准组件用于编写新标准,用户可选择编写模板、输入标准名称、进入标准编写,如果模版内容与要编写标准差距较大,也可以支持用户编写模版。编辑章节目录组件用于对章节目录进行新增、删除操作,点击标准章节可对章节名称以及序号进行修改。标准/章节/术语推荐组件,支持用户可选择地对推送的相关标准、标准章节内容、术语内容进行自由组合,自动生成标准。
手动编辑标准内容组件,支持用户可手动编辑标准章节内容,包括文字、图片、表格等。用户点击章节内容,可在弹出的编辑框内编辑表格内容、文字的字体、字号、段落格式等,同时可进行撤销、查找替换、插入特殊字符等一系列文本操作。
插入图片组件用于推荐用户选择“标准图库”进行图片的插入,用户可于标准图库界面上次图片并插入到正文内容中。修改表题图题组件支持用户在输入图题、表题时,可通过在图题、表题后回车实现图题、表题格式转换。标准基本信息修改组件,支持用户可在工具左上角编辑标准名称,可在基本信息栏目修改标准题录信息。
保存标准组件,支持用户在保存标准时可将标准保存为历史版本,方便用户查看、恢复历史版本,并可实现历史版本对比。记录标准从草案到报批稿状态组件,支持用户在标准基本信息界面可确定编制标准状态,包括草案、征求意见、送审稿、报批稿,可实现记录标准从草案到报批稿状态功能。标准完成组件,用户可在提交标准完成界面提交标准编号、发布日期及实施日期,并确定标准题录信息,提交标准完成后标准会到已完成界面。
标准导出组件,用户可将标准导出为标准数据文件或Word文件,导出后自动实现格式转换。我的标准组件,包括草稿箱、已完成,用户可进行查询、编辑、导出、完成、删除的操作。我的模板组件,用户可选择上传模板,可进行查询、下载、删除操作。回收站组件,存储用户在编写过程中删除的标准文本,用户可进行查询、查看、恢复、删除操作。
图3为本发明实施例提供的基于标准知识图谱的标准编写系统的框图。参阅图3,该基于标准知识图谱的标准编写系统300包括标准模板设计模块310、标准条款筛选模块320、标准文摘提取模块330以及推送及编写模块340。
标准模板设计模块310例如执行步骤S1,用于根据用户的标准编写需求,从标准数据库中筛选出相应的初始标准模板,以及自动生成相应的特定标准模板。
标准条款筛选模块320例如执行步骤S2,用于根据标准编写过程中用户输入的编写内容,从标准数据库中筛选出与编写内容相关的标准条款。
标准文摘提取模块330例如执行步骤S3,用于从标准数据库中筛选出与编写内容的主题相关的标准文本,并从标准文本中提取出标准文摘。
推送及编写模块340例如执行步骤S4,用于将初始标准模板、特定标准模板、标准条款和标准文摘推送给用户,使得用户利用初始标准模板、特定标准模板、标准条款和标准文摘进行标准编写。
基于标准知识图谱的标准编写系统300用于执行上述图1-图2所示实施例中的基于标准知识图谱的标准编写方法。本实施例未尽之细节,请参阅前述图1-图2所示实施例中的基于标准知识图谱的标准编写方法,此处不再赘述。
本公开的实施例还示出了一种电子设备,如图4所示,电子设备400包括处理器410、可读存储介质420。该电子设备400可以执行上面图1-图2中描述的基于标准知识图谱的标准编写方法。
具体地,处理器410例如可以包括通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器410还可以包括用于缓存用途的板载存储器。处理器410可以是用于执行参考图1-图2描述的根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
可读存储介质420,例如可以是能够包含存储、传送、传播或传输指令的任意介质。例如,可读存储介质可以包括但不限于电、磁、光、电磁、红外或半导体系统、装置、器件或传播介质。可读存储介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。
可读存储介质420可以包括计算机程序421,该计算机程序421可以包括代码/计算机可执行指令,其在由处理器410执行时使得处理器410执行例如上面结合图1-图2所描述的方法流程及其任何变形。
计算机程序421可被配置为具有例如包括计算机程序模块的计算机程序代码。例如,在示例实施例中,计算机程序421中的代码可以包括一个或多个程序模块,例如包括421A、模块421B、……。应当注意,模块的划分方式和个数并不是固定的,本领域技术人员可以根据实际情况使用合适的程序模块或程序模块组合,当这些程序模块组合被处理器410执行时,使得处理器410可以执行例如上面结合图1-图2所描述的方法流程及其任何变形。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,程序被处理器执行时实现图1-图2中描述的基于标准知识图谱的标准编写方法。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (6)

1.一种基于标准知识图谱的标准编写方法,其特征在于,包括:
步骤S1,根据用户的标准编写需求,从标准数据库中筛选出相应的初始标准模板,以及自动生成相应的特定标准模板;
步骤S2,根据标准编写过程中用户输入的编写内容,从所述标准数据库中筛选出与所述编写内容相关的标准条款;
步骤S3,从所述标准数据库中筛选出与所述编写内容的主题相关的标准文本,并从所述标准文本中提取出标准文摘;
步骤S4,将所述初始标准模板、所述特定标准模板、所述标准条款和所述标准文摘推送给用户,使得用户利用所述初始标准模板、所述特定标准模板、所述标准条款和所述标准文摘进行标准编写;
所述步骤S2具体包括:提取所述编写内容的主题关键词;计算所述主题关键词与所述标准数据库中各标准条款之间的相似度,并从中选取出若干个最高相似度对应的标准条款;
所述方法还包括:根据所述标准编写需求对应的标准类型、以及所述编写内容中的标准化对象,从标准知识图谱中检索匹配的第一标准指标;将所述第一标准指标推送给用户,使得用户利用所述第一标准指标进行标准编写;
其中,当所述标准知识图谱中存在与所述标准类型匹配的标准指标,且不存在与所述标准化对象匹配的标准指标时,所述第一标准指标为标准知识图谱中与所述标准类型匹配的标准指标;
当所述标准知识图谱中存在与所述标准化对象匹配的标准指标,且不存在与所述标准类型匹配的标准指标时,所述从标准知识图谱中检索匹配的第一标准指标包括:根据所述编写内容中的产品类别,从所述标准知识图谱中检索匹配的第二标准指标,其中,所述产品类别为所述标准化对象的下一层级;从所述第二标准指标中检索出与所述标准化对象匹配的第一标准指标。
2.根据权利要求1所述的基于标准知识图谱的标准编写方法,其特征在于,所述步骤S1包括:
根据所述标准编写需求对应的标准类型,从所述标准数据库中筛选出匹配的第一标准模板以组成定制数据库;
根据所述标准编写需求中的用户需求信息,从所述定制数据库中筛选出匹配的第二标准模板以作为所述初始标准模板;
获取用户对所述初始标准模板的编辑指令,根据所述标准编写需求、所述初始标准模板和所述编辑指令,自动生成所述特定标准模板。
3.根据权利要求1所述的基于标准知识图谱的标准编写方法,其特征在于,方法还包括:
获取用户编写的标准文档,并按照目标格式要求对所述标准文档进行格式转换。
4.一种基于标准知识图谱的标准编写系统,其特征在于,包括:
标准模板设计模块,用于根据用户的标准编写需求,从标准数据库中筛选出相应的初始标准模板,以及自动生成相应的特定标准模板;
标准条款筛选模块,用于根据标准编写过程中用户输入的编写内容,从所述标准数据库中筛选出与所述编写内容相关的标准条款;
标准文摘提取模块,用于从所述标准数据库中筛选出与所述编写内容的主题相关的标准文本,并从所述标准文本中提取出标准文摘;
推送及编写模块,用于将所述初始标准模板、所述特定标准模板、所述标准条款和所述标准文摘推送给用户,使得用户利用所述初始标准模板、所述特定标准模板、所述标准条款和所述标准文摘进行标准编写;
所述标准条款筛选模块具体用于:提取所述编写内容的主题关键词;计算所述主题关键词与所述标准数据库中各标准条款之间的相似度,并从中选取出若干个最高相似度对应的标准条款;
所述系统还用于:根据所述标准编写需求对应的标准类型、以及所述编写内容中的标准化对象,从标准知识图谱中检索匹配的第一标准指标;将所述第一标准指标推送给用户,使得用户利用所述第一标准指标进行标准编写;
其中,当所述标准知识图谱中存在与所述标准类型匹配的标准指标,且不存在与所述标准化对象匹配的标准指标时,所述第一标准指标为标准知识图谱中与所述标准类型匹配的标准指标;
当所述标准知识图谱中存在与所述标准化对象匹配的标准指标,且不存在与所述标准类型匹配的标准指标时,所述从标准知识图谱中检索匹配的第一标准指标包括:根据所述编写内容中的产品类别,从所述标准知识图谱中检索匹配的第二标准指标,其中,所述产品类别为所述标准化对象的下一层级;从所述第二标准指标中检索出与所述标准化对象匹配的第一标准指标。
5.一种电子设备,其特征在于,包括:
处理器;
存储器,其存储有计算机可执行程序,所述程序在被所述处理器执行时,使得所述处理器执行如权利要求1-3中任一项所述的基于标准知识图谱的标准编写方法。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-3中任一项所述的基于标准知识图谱的标准编写方法。
CN202310373909.0A 2023-04-10 2023-04-10 基于标准知识图谱的标准编写方法、系统、设备及介质 Active CN116090416B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310373909.0A CN116090416B (zh) 2023-04-10 2023-04-10 基于标准知识图谱的标准编写方法、系统、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310373909.0A CN116090416B (zh) 2023-04-10 2023-04-10 基于标准知识图谱的标准编写方法、系统、设备及介质

Publications (2)

Publication Number Publication Date
CN116090416A CN116090416A (zh) 2023-05-09
CN116090416B true CN116090416B (zh) 2023-06-27

Family

ID=86210586

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310373909.0A Active CN116090416B (zh) 2023-04-10 2023-04-10 基于标准知识图谱的标准编写方法、系统、设备及介质

Country Status (1)

Country Link
CN (1) CN116090416B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117648909B (zh) * 2024-01-29 2024-04-12 国网湖北省电力有限公司信息通信公司 一种基于人工智能的电力系统公文数据管理系统及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111401022A (zh) * 2020-03-11 2020-07-10 中国计量大学 一种管理标准模板快速生成系统及方法
CN112182148A (zh) * 2020-09-14 2021-01-05 山西和耀科技有限公司 一种基于全文检索的标准辅助编写方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112732945B (zh) * 2021-03-30 2021-06-18 中国电子技术标准化研究院 标准知识图谱构建、标准查询方法及装置
CN113177125B (zh) * 2021-06-30 2021-09-03 中国电子技术标准化研究院 标准知识图谱构建、标准查询方法及装置
CN115937881A (zh) * 2022-10-22 2023-04-07 南方电网科学研究院有限责任公司 一种知识图谱构建标准表格内容自动识别方法
CN115906775A (zh) * 2022-11-09 2023-04-04 云南电网有限责任公司昆明供电局 一种数字标准编撰系统
CN115577694B (zh) * 2022-11-15 2023-05-30 南方电网科学研究院有限责任公司 标准编写的智能推荐方法
CN115688733B (zh) * 2022-12-29 2023-05-02 南方电网科学研究院有限责任公司 标准文档编写的方法和系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111401022A (zh) * 2020-03-11 2020-07-10 中国计量大学 一种管理标准模板快速生成系统及方法
CN112182148A (zh) * 2020-09-14 2021-01-05 山西和耀科技有限公司 一种基于全文检索的标准辅助编写方法

Also Published As

Publication number Publication date
CN116090416A (zh) 2023-05-09

Similar Documents

Publication Publication Date Title
KR102158352B1 (ko) 정책정보 문서의 요지 정보 제공 방법, 정책정보 제공 시스템, 이를 위한 컴퓨터 프로그램
US20160179931A1 (en) System And Method For Supplementing Search Queries
US7673235B2 (en) Method and apparatus for utilizing an object model to manage document parts for use in an electronic document
US9323731B1 (en) Data extraction using templates
CN114616572A (zh) 跨文档智能写作和处理助手
EP2041672B1 (en) Methods and apparatus for reusing data access and presentation elements
US7617444B2 (en) File formats, methods, and computer program products for representing workbooks
US8417513B2 (en) Representation of objects and relationships in databases, directories, web services, and applications as sentences as a method to represent context in structured data
US20100088605A1 (en) System and method for automatic improvement of electronic presentations
WO2006102512A2 (en) Change control management of xml documents
US7853595B2 (en) Method and apparatus for creating a tool for generating an index for a document
CN116090416B (zh) 基于标准知识图谱的标准编写方法、系统、设备及介质
CN111753536B (zh) 一种专利申请文本的自动撰写方法和装置
JP2020113129A (ja) 文書評価装置、文書評価方法及びプログラム
CN111191429A (zh) 数据表格自动填充的系统和方法
US8799256B2 (en) Incorporated web page content
CN113722352A (zh) 一种报审价方案的智能数据校验方法、系统及存储介质
CN113657080A (zh) 一种基于xml的结构化系统及数据包创建方法
US20090217156A1 (en) Method for Storing Localized XML Document Values
CN102360351A (zh) 一种对电子图书内容进行语义描述的方法及系统
JP2003288332A (ja) 構造化文書作成支援方法及び構造化文書作成支援システム
CN112487160B (zh) 技术文档溯源方法及装置、计算机设备、计算机存储介质
Raghallaigh et al. Ainm. ie: Breathing New Life into a Canonical Collection of Irish-language Biographies.
CN115906769A (zh) 一种数据关系构建方法及装置
Petrovski A Bilingual English-Ukrainian Lexicon of Named Entities Extracted from Wikipedia

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant