CN113392072B - 标准知识服务方法、装置、电子设备和存储介质 - Google Patents
标准知识服务方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN113392072B CN113392072B CN202110713030.7A CN202110713030A CN113392072B CN 113392072 B CN113392072 B CN 113392072B CN 202110713030 A CN202110713030 A CN 202110713030A CN 113392072 B CN113392072 B CN 113392072B
- Authority
- CN
- China
- Prior art keywords
- standard
- knowledge
- file
- searched
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/148—File search processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/156—Query results presentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Library & Information Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例提供了一种标准知识服务方法、装置、电子设备和存储介质,首先接收标准文件检索指令,然后解析标准文件检索指令,提取检索范围及检索关键字,再基于检索范围及检索关键字在标准知识元数据库中查找对应的标准文件,其中,标准知识元数据库由多个标准知识元构建组成;进而,基于标准知识服务模型对查找到的标准文件进行分析,输出标准知识分析结果,从而可以为用户输出一个标准知识分析结果,而不仅仅是输出一个标准文件,以使用户可以获得更全面、更准确的标准知识,提高标准化的研究和应用水平。
Description
技术领域
本申请涉及数据分析技术,具体地,涉及一种标准知识服务方法、装置、电子设备和存储介质。
背景技术
标准文件是为了在一定范围内获得最佳次序,经协商一致制定并由公认机构批准,共同使用和重复使用的一种规范性文件。
目前,为了让用户能够全面、及时、准确地获得标准信息,各级标准化组织均建立了自己的标准检索平台,例如国际标准化组织(ISO)、国际电信联盟(ITU)、国际电工委员会(IEC)等国际标准文件检索平台,国内的国家标准全文公开系统、全国标准信息公共服务平台、国家标准文件共享服务平台等标准文件管理平台等。
但是,现有的标准服务平台只能为用户提供简单的检索和数据浏览服务,无法对检索出的标准文件进行深层次加工以实现标准的知识萃取。例如,目前的标准服务平台主要提供按标准名称(或标准号)和全文检索两种检索方式,标准名称(或标准号)能够实现精确检索,但查询方式不够灵活,全文检索能够为用户搜索到更多的相关信息,但同时也会带来大量的信息冗余。
发明内容
本申请实施例中提供了一种标准知识服务方法、装置、电子设备和存储介质,用于解决现有技术中检索方式不够灵活,以及无法对检索出的标准文件进行分析的问题。
根据本申请实施例的第一个方面,提供了一种标准知识服务方法,包括:
接收标准文件检索指令;
解析所述标准文件检索指令,提取检索范围及检索关键字;
基于所述检索范围及所述检索关键字在所述标准知识服务模型的标准知识元数据库中查找对应的标准文件,其中,所述标准知识元数据库由多个标准知识元构建形成;
基于所述标准知识服务模型对查找到的标准文件进行分析,输出标准知识分析结果,其中,所述标准知识服务模型包括知识搜索单元、语义分析单元及知识可视化单元。
根据本申请实施例的第二个方面,提供了一种标准知识服务装置,包括:
接收模块,用于接收标准文件检索指令;
解析模块,用于解析所述标准文件检索指令,提取检索范围及检索关键字;
文件查找模块,用于基于所述检索范围及所述检索关键字在所述标准知识服务模型的标准知识元数据库中查找对应的标准文件,其中,所述标准知识元数据库由多个标准知识元构建形成;
分析输出模块,用于基于所述标准知识服务模型对查找到的标准文件进行分析,输出标准知识分析结果,其中,所述标准知识服务模型包括知识搜索单元、语义分析单元及知识可视化单元。
根据本申请实施例的第三个方面,提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当所述电子设备运行时,所述处理器与所述存储器之间通过所述总线通信,所述机器可读指令被所述处理器执行时执行标准知识服务方法。
根据本申请实施例的第四个方面,提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行标准知识服务方法。
采用本申请实施例提供的一种标准知识服务方法,接收标准文件检索指令;解析所述标准文件检索指令,提取检索范围及检索关键字;基于所述检索范围及所述检索关键字在标准知识服务模型中查找对应的标准文件,其中,标准知识元数据库由多个标准知识元构建组成;基于所述标准知识服务模型对查找到的标准文件进行分析,输出标准知识分析结果,其中,标准知识服务模型还包括知识搜索单元、语义分析单元及知识可视化单元。解析用户输入的标准文件检索指令得到检索范围及检索关键字,利用检索关键字和检索范围在标准知识服务模型的标准知识元数据库中查询相关的标准文件,并基于标准知识服务模型对查找到的标准文件进行进一步分析,为用户输出标准知识分析结果,而不仅仅是输出一个检索到的标准文件,使用户可以获得更全面、更准确的标准知识,提高标准化的研究和应用水平。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的标准知识服务方法的流程图之一;
图2为本申请实施例提供的标准文件检索的交互界面示意图;
图3为本申请实施例提供的检索示例的界面示意图;
图4为本申请实施例提供的标准知识服务方法的流程图之二;
图5为本申请实施例提供的步骤S15的子步骤流程图;
图6为本申请实施例提供的标准知识服务模型的示意图;
图7为本申请实施例提供的标准主题的可视化展示界面示意图;
图8为本申请实施例提供的起草单位的合作关系分析结果的可视化展示示意图;
图9为本申请实施例提供的起草人的合作关系分析结果的可视化展示示意图;
图10为本申请实施例提供的标准知识服务装置的功能模块图;
图11为本申请实施例提供的电子设备的示意图。
具体实施方式
在实现本申请的过程中,发明人发现,为了让用户能够全面、及时、准确地获得标准信息,更好地促进标准的转化利用,各级标准化组织均建立了自己的标准检索平台,例如国际标准化组织(ISO)、国际电信联盟(ITU)、国际电工委员会(IEC)等国际标准文件检索平台,欧洲标准化委员会(CEN)、泛美技术标准委员会(COPANT)、太平洋地区标准大会(PASC)等区域标准文件检索平台,美国国家标准学会(ANSI)、英国标准化学会(BS)、德国标准化学会(DIN)、日本工业标准(JIS)等国际标准文件检索平台。在国内,从国家到地方也建立了国家标准全文公开系统、全国标准信息公共服务平台、国家标准文件共享服务平台等标准文件管理平台。
但是,现有的标准服务平台只能为用户提供简单的检索和数据浏览服务,无法对检索出的标准文件进行深层次加工以实现标准的知识萃取。例如,目前的标准服务平台主要提供按标准名称(或标准号)和全文检索两种检索方式,标准名称(或标准号)能够实现精确检索,但查询方式不够灵活,全文检索能够为用户搜索到更多的相关信息,但同时也会带来大量的信息冗余。
因此,目前的标准文件管理平台无法满足各行业用户日益增长的标准化的应用需求。
针对上述问题,本申请实施例中提供了一种标准知识服务方法,接收标准文件检索指令;解析所述标准文件检索指令,提取检索范围及检索关键字;基于所述检索范围及所述检索关键字在标准知识服务模型中查找对应的标准文件,其中,标准知识元数据库由多个标准知识元构建组成;基于所述标准知识服务模型对查找到的标准文件进行分析,输出标准知识分析结果,其中,标准知识服务模型还包括知识搜索单元、语义分析单元及知识可视化单元。解析用户输入的标准文件检索指令得到检索范围及检索关键字,利用检索关键字和检索范围在标准知识服务模型的标准知识元数据库中查询相关的标准文件,并基于标准知识服务模型对查找到的标准文件进行进一步分析,为用户输出标准知识分析结果,而不仅仅是输出一个检索到的标准文件,使用户可以获得更全面、更准确的标准知识,提高标准化的研究和应用水平。
本申请实施例中的方案可以采用各种计算机语言实现,例如,面向对象的程序设计语言Java和直译式脚本语言JavaScript等。
为了使本申请实施例中的技术方案及优点更加清楚明白,以下结合附图对本申请的示例性实施例进行进一步详细的说明,显然,所描述的实施例仅是本申请的一部分实施例,而不是所有实施例的穷举。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
请参阅图1,图1为本申请实施例提供的标准知识服务方法的流程图之一。在本实施例中,标准知识服务方法可以应用于电子设备,包括以下步骤:
步骤S11,接收标准文件检索指令。
步骤S12,解析标准文件检索指令,提取检索范围及检索关键字。
步骤S13,基于检索范围及检索关键字在标准知识服务模型的标准知识元数据库中查找对应的标准文件。
步骤S14,基于标准知识服务模型对查找到的标准文件进行分析,输出标准知识分析结果。
其中,标准知识元数据库由多个标准知识元构建形成,标准知识服务模型除标准知识元数据库外,还包括知识搜索单元、语义分析单元及知识可视化单元。
在上述步骤中,解析用户输入的标准文件检索指令得到检索范围及检索关键字,利用检索关键字和检索范围在标准知识元数据库中查询相关的标准文件,并对查找到的标准文件进行进一步分析,为用户输出标准知识分析结果,而不仅仅是输出一个标准文件,以使用户可以获得更全面、更准确的标准知识,提高标准化的研究和应用水平。
进一步地,需要说明的是,标准文件是为了在一定范围内获得最佳次序,经协商一致制定并由公认机构批准,共同使用和重复使用的一种规范性文件。标准文件具有相应的撰写规范,通常来说,标准文件的内容应当包括标准名称、标准号、发布日期、实施日期、起草人、起草单位等题录信息,以及适用范围、规范性引用文件、术语、编码表信息。
在标准化的研究中,研究人员(即用户)可能需要查看某些已经编写完成的标准文件,在其基础上进行修改或编写新的标准文件,因此,研究人员可以在电子设备的交互界面的下拉菜单中选择检索范围,并键入检索关键字,从而形成标准文件检索指令。如图2所示,图2为本申请实施例提供的标准文件检索的交互界面示意图。
在接收到标准文件检索指令之后,电子设备可以对标准文件检索指令进行解析,获得检索范围及检索关键字。其中,检索范围包括适用范围、术语、起草人、起草单位、引用标准、编码、标准文件的名称及标准文件的标准号等。检索关键字即为研究人员通过交互界面输入的与检索范围对应的关键字。例如,检索范围可以为适用范围,此时对应的检索关键字可以为某个标准应用领域,如“资产管理”;再例如,检索范围可以为起草人,此时对应的检索关键字则可以为标准文件的起草人的名字,如“张三”。再例如,当检索范围为引用标准,检索关键字为“中华人民共和国行政区划代码”时,即可以检索出所有引用了中华人民共和国行政区划代码标准的标准文件,如图3所示,图3为本申请实施例提供的检索示例的界面示意图,在图3中,在用户输入检索关键字之后,输出一个检索列表,检索列表中包括了所有引用了中华人民共和国行政区划代码标准的标准文件信息。
用户若需要获得更进一步地分析,可以点击图3所示的交互界面上的知识图谱控件,以对查找获得的标准文件进行进一步分析,并为用户输出标准知识分析结果。
可选地,请参阅图4,图4为本申请实施例提供的标准知识服务方法的流程图之二,在步骤S11之前,标准知识服务方法还可以包括:
步骤S15,建立标准知识服务模型。
在本步骤中,为了实现对标准文件的查询和检索,还需要事先建立一个标准知识服务模型。进一步地,请参阅图5,图5为本申请实施例提供的步骤S15的子步骤流程图,在本实施例中,步骤S15包括:
子步骤S151,基于知识元抽取规则对获取到的标准文件进行知识元抽取,建立标准知识元数据库。
子步骤S152,对标准知识元数据库中的多个标准知识元进行动态链接,并根据标准知识元数据库、知识搜索单元、语义分析单元及知识可视化单元构建标准知识服务模型。
其中,所述标准知识服务模型用于实现标准文件的知识搜索、知识挖掘及知识可视化。
在本实施例中,首先需要获取大量的已经发布的标准文件,并对标准文件进行知识元抽取,建立一个标准知识元数据库,其中,标准知识元数据库包括有多个标准知识元,然后再基于预设的规则对标准知识元数据库中的标准知识元进行动态链接,构建一个标准知识服务模型。
具体地,知识元是指不可再分割的具有完备知识表达的知识单位,从类型上分,包括概念知识元、事实知识元和数值型知识元等。
知识元是显性知识的最小可控单位,所谓显性知识,是相较于存在于人脑中的隐性知识而言的,能用文字和数字表达出来,容易以硬数据的形式交流和共享,并且经编辑整理的知识,显性知识是以一定的形式记载在一定的载体上,如文献等,显性知识载体上的内容是诸多知识元的组合。
知识元是完备的,即一个知识元在逻辑上是完整的,能表达一个完整的事实、原理、方法、技巧等;知识元是有一定结构的,而且由于这种结构性,导致了知识表达的一系列方法仍对表达知识元适用;众多的知识元通过一定的语义连接在一起,可以导致知识价值的增值,甚至是催生新的知识,通过知识元的链接和发掘各知识元的相关联系,是知识元服务的重要手段和目的,以此来揭示知识元之间的各种关联,得以创造新的知识。
具体地,在本实施例中,基于知识元抽取规则对获取到的标准文件进行知识元抽取,建立标准知识元数据库的步骤包括:
对所述标准文件的内容进行解析,获取所述标准文件中的题录信息、适用范围、规范性引用文件、编码表信息及术语信息;对所述题录信息、所述适用范围、所述规范性引用文件、所述编码表信息及所述术语信息分别进行信息抽取,获得题录知识元、适用范围知识元、引用文件知识元、编码知识元及术语知识元;基于所述题录知识元、所述适用范围知识元、所述引用文件知识元、所述编码知识元及所述术语知识元建立标准知识元数据库。
在本实施例中,由于每个标准文件都包括有适用范围、术语、起草人、起草单位、引用标准、编码、标准文件的名称及标准文件的标准号等信息,因此,在进行知识元抽取时,可以将标准文件的适用范围、起草人、起草单位、标准文件的名称及标准文件的标准号抽取出来作为标准文件的题录信息,从而获得题录知识元;同理,还可以将每个标准文件的术语抽取出来作为术语信息,从而获得术语知识元;将每个标准文件的引用标准抽取出来作为引用信息,从而获得引用标准知识元,以及还可以通过知识元抽取获得编码知识元。也就是说,标准知识元包括题录知识元、术语知识元、编码知识元以及引用标准知识元。在获得多个标准知识元之后,即可建立一个标准知识元数据库。然后可以基于预设规则对所述标准知识元数据库中的多个标准知识元进行动态链接,构建标准知识服务模型,以将各个标准文件与不同的标准知识元链接起来。如图6所示,图6为本申请实施例提供的标准知识服务模型的示意图。
将非结构化的标准文件转化为结构化的标准知识元,通过标准知识元对标准文件的内容进行知识化表征,标准知识元中存储的不仅仅是结构化后的标准文本,还包括了该标准知识元内部结构和标准知识元之间的关系,例如编码表中编码之间的树状隶属关系等。进一步,还能够利用标准知识元之间的关系来建立标准知识链接,形成标准知识网络,从而实现标准文件的检索、分析和可视化表示。
可选地,在本实施例中,步骤S14,基于标准知识服务模型对查找到的标准文件进行分析,输出标准知识分析结果,可以包括:
基于所述语义分析单元对查找到的标准文件进行标准主题、关联度和/或合作关系的分析,并通过所述知识可视化单元输出标准知识的可视化分析结果。
其中,所述标准文件由所述标准知识服务模型的知识搜索单元在所述标准知识元数据库中查找获得。
具体地,基于所述语义分析单元对查找到的标准文件进行标准主题、关联度和/或合作关系的分析,并通过所述知识可视化单元输出标准知识的可视化分析结果,包括:
基于所述标准知识服务模型的语义分析单元对所述查找到的标准文件的文件名称或适用范围进行分析,获得各个标准文件对应的标准主题及各个标准主题的权重;通过知识可视化单元的知识图谱对各个标准文件对应的标准主题及各个标准主题的权重进行可视化展示。
可选地,在本实施例中,标准知识服务模型由多个标准知识元构成,通过标准知识服务模型可以对查找到的标准文件的文件名称、适用范围等知识元进行分析。具体可以通过自然语言处理技术和词袋模型等算法对查找到的标准文件的文件名称或适用范围进行分析,分析出查找到的标准文件的文件名称或者适用范围中的标准主题,并对标准主题的出现次数进行计算,获得标准主题的权重,出现次数越多则该标准主题的权重越大。
在计算出权重之后即可通过知识图谱对各个标准文件的标准主题及权重进行可视化展示。在本实施例中,可以通过字体的大小表示不同标准主题的权重,例如,标准主题出现次数越多,则权重越大,可以用较大字号的字体表示该标准主题,权重越小的标准主题则用较小字号的字体进行表示。如图7所示,图7为本申请实施例提供的标准主题的可视化展示界面示意图。
基于上述的可视化展示,用户可以直观地看出查找到的标准文件的适用范围或标准主题以及各个标准主题出现频次,便于用户进行后续分析。
可选地,在本实施例中,所述基于所述语义分析单元对查找到的标准文件进行标准主题、关联度和/或合作关系的分析,并通过所述知识可视化单元输出标准知识的可视化分析结果,还可以包括:
基于所述语义分析单元对各个标准文件对应的标准主题进行分析,并计算所述查找到的标准文件之间的主题相似度;基于所述语义分析单元对各个标准文件的引用标准进行分析,并计算所述查找到的标准文件之间的共引相似度;根据所述主题相似度及所述共引相似度计算所述查找到的标准文件之间的关联度;通过知识可视化单元的知识图谱对所述查找到的标准文件之间的关联度进行可视化展示。
在本实施例中,还可以根据查找到的标准文件中每个标准文件对应的标准主题计算各个标准文件的主题相似度,以及根据查找到的每个标准文件的引用标准计算各个标准文件的共引相似度。其中,共引相似度则是根据任意两个标准文件共同引用的规范性引用文件或标准进行度量,如果任意两个标准文件中共同引用的规范性引用文件或标准越多,则这两个标准文件的共引相似度越高;主题相似度则用于表示各个标准文件的标准主题之间的相似度。
通过主题相似度和共引相似度进行进一步分析,可以计算获得两个标准文件之间的关联性,然后可以基于知识图谱对标准文件之间的关联性进行可视化展示,以使用户可以直观地看出根据检索指令查找到的标准文件之间的关联性,便于后续对标准化的研究和应用。
可选地,在本实施例中,所述基于所述语义分析单元对查找到的标准文件进行标准主题、关联度和/或合作关系的分析,并通过所述知识可视化单元输出标准知识的可视化分析结果,还可以包括:
获取所述查找到的标准文件的起草单位信息;基于所述语义分析单元对所述查找到的标准文件的起草单位进行合作关系分析,获得各个起草单位的合作关系分析结果;通过知识可视化单元的知识图谱对所述起草单位的合作关系分析结果进行可视化展示。
在上述步骤中,还可以对查找到的标准文件的起草单位信息进行分析,获得查找到的标准文件中的每一个标准文件的起草单位,每个标准文件可以有至少一个起草单位,然后对各个起草单位之间的合作关系进行分析,获得各个起草单位的合作关系分析结果,其中,起草单位的合作关系是指任意两个不同的起草单位共同起草了同一份标准文件。
然后可以通过知识图谱的方式对各个起草单位的合作关系分析结果进行可视化展示。具体地,如图8所示,图8为本申请实施例提供的起草单位的合作关系分析结果的可视化展示示意图。在图8中,不同的圆代表不同的起草单位,每个圆可以用不同的颜色填充,用于表示不同的起草单位,还可以用不同直径的圆表示各个起草单位起草的标准文件数量,直径越大则表示起草的标准文件的数量越多。任意两个起草单位如果起草了同一份标准文件,则可以用线段连接这两个起草单位对应的圆,若两个圆之间的线段数量越多,则表示这两个起草单位的合作次数越多。
通过这种可视化的方式,可以使用户更加直观的看出各个起草单位起草的标准文件的数量以及合作关系,便于后续对标准化的研究和应用。
可选地,在本实施例中,所述基于所述语义分析单元对查找到的标准文件进行标准主题、关联度和/或合作关系的分析,并通过所述知识可视化单元输出标准知识的可视化分析结果,还可以包括:
获取所述查找到的标准文件的起草人信息;通过所述语义分析单元对所述查找到的标准文件的起草人进行合作关系分析,获得各个起草人的合作关系分析结果;通过所述知识可视化单元的知识图谱对所述起草人的合作关系分析结果进行可视化展示。
在上述步骤中,还可以对查找到的标准文件的起草人信息进行分析,获得查找到的标准文件中的每一个标准文件的起草人,每个标准文件可以有至少一个起草人,然后对各个起草人之间的合作关系进行分析,获得各个起草人的合作关系分析结果,其中,起草人的合作关系是指任意两个不同的起草人共同起草了同一份标准文件。
然后可以通过知识图谱的方式对各个起草人的合作关系分析结果进行可视化展示。具体地,如图9所示,图9为本申请实施例提供的起草人的合作关系分析结果的可视化展示示意图。在图9中,不同的圆代表不同的起草人,每个圆可以用不同的颜色填充,用于表示不同的起草人,或者每个圆可以用不同的填充形式进行填充,用于表示不同的起草人,还可以用不同直径的圆表示各个起草人起草的标准文件数量,直径越大则表示该起草人起草的标准文件的数量越多。任意两个起草人如果起草了同一份标准文件,则可以用线段连接这两个起草人对应的圆,若两个圆之间的线段数量越多,则表示这两个起草单位的合作次数越多。
通过这种可视化的方式,可以使用户更加直观的看出各个起草人起草的标准文件的数量以及合作关系,便于后续对标准化的研究和应用。
进一步地,对所述查找到的标准文件的起草人进行合作关系分析,获得各个起草人的合作关系分析结果,包括:
针对获取到的起草人信息,计算每个起草人在所述查找到的标准文件中出现的次数;计算任意两个起草人在所述查找到的标准文件中的合作起草次数,其中,所述合作起草次数是指任意两个起草人同时出现在同一个标准文件的起草人信息中。
在上述步骤中,在构建起草人知识图谱时,可以遍历每一个查找到的标准文件,获得每一个标准文件对应的起草人信息,并建立一个标准文件-起草人的矩阵,针对每一个起草人,判断该起草人出现在各个标准文件的起草人信息中,若出现,则标记为1,否则标记为0,因此,而已根据每个起草人对应的标记1的数量计算各个起草人起草的标准文件的数量。例如,若查找到了30个标准文件,起草人A对应的标记1的数量为10,则表示起草人A起草了在这30个标准文件中的10个标准文件。
在本步骤中,起草人-起草人矩阵用于表示各个起草人之间的合作关系,若任意两个起草人共同起草了同一个标准文件,则可以在矩阵中与这两个起草人对应的位置进行标记,根据标记数量即可计算获得各个起草人之间的合作起草次数。然后可以根据起草人-起草人矩阵获得起草人的合作关系分析结果。
综上所述,本申请实施例提供了一种标准知识服务方法,包括构建标准知识元数据库及标准知识服务模型,然后可以基于构建的标准知识服务模型进行标准文件的检索,并基于检索到的标准文件进行后续的起草人、起草单位、关联性及标准主题等方面的分析,通过可视化方式进行分析结果的展示,从而将标准文件的共享服务模式由文件共享转变为分析知识的共享,提高标准化的研究和应用水平。
请参阅图10,图10为本申请实施例提供的标准知识服务装置的功能模块图,在本实施例中,标准知识服务装置110包括:
接收模块1101,用于接收标准文件检索指令。
解析模块1102,用于解析所述标准文件检索指令,提取检索范围及检索关键字。
文件查找模块1103,用于基于所述检索范围及所述检索关键字在所述标准知识服务模型的标准知识元数据库中查找对应的标准文件,其中,所述标准知识元数据库由多个标准知识元构建形成。
分析输出模块1104,用于基于所述标准知识服务模型对查找到的标准文件进行分析,输出标准知识分析结果,其中,所述标准知识服务模型包括知识搜索单元、语义分析单元及知识可视化单元。
本申请实施例还提供了一种电子设备,请参照图11,图11为本申请实施例提供的电子设备10的示意图。在本实施例中,电子设备10包括:处理器11、存储器12和总线13,存储器12存储有处理器11可执行的机器可读指令,当电子设备10运行时,11处理器与存储器12之间通过总线13通信,机器可读指令被处理器11执行时执行本申请实施例提供的标准知识服务方法。
可选地,本申请实施例还提供了一种存储介质,存储介质上存储有计算机程序,所述计算机程序被处理器11运行时执行本申请实施例提供的标准知识服务方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种标准知识服务方法,其特征在于,包括:
接收标准文件检索指令;
解析所述标准文件检索指令,提取检索范围及检索关键字,其中,所述检索范围包括适用范围、术语、起草人、起草单位、引用标准、编码、标准文件的名称及标准文件的标准号;
基于所述检索范围及所述检索关键字在所述标准知识服务模型的标准知识元数据库中查找对应的标准文件,其中,所述标准知识元数据库由多个标准知识元构建形成;
基于所述标准知识服务模型对查找到的标准文件进行分析,输出标准知识分析结果,其中,所述标准知识服务模型还包括知识搜索单元、语义分析单元及知识可视化单元;
其中,所述基于所述标准知识服务模型对查找到的标准文件进行分析,输出标准知识分析结果,包括:基于所述语义分析单元对查找到的标准文件进行标准主题、关联度和/或合作关系的分析,并通过所述知识可视化单元输出标准知识的可视化分析结果,其中,所述标准文件由所述标准知识服务模型的知识搜索单元在所述标准知识元数据库中查找获得;
所述基于所述语义分析单元对查找到的标准文件进行标准主题、关联度和/或合作关系的分析,并通过所述知识可视化单元输出标准知识的可视化分析结果,包括:通过所述语义分析单元对各个标准文件对应的标准主题进行分析,并计算所述查找到的标准文件之间的主题相似度;通过所述语义分析单元对各个标准文件的引用标准进行分析,并计算所述查找到的标准文件之间的共引相似度;根据所述主题相似度及所述共引相似度计算所述查找到的标准文件之间的关联度;通过所述知识可视化单元的知识图谱对所述查找到的标准文件之间的关联度进行可视化展示。
2.根据权利要求1所述的方法,其特征在于,在接收标准文件检索指令之前,所述方法还包括建立标准知识服务模型的步骤,所述步骤包括:
基于知识元抽取规则对获取到的标准文件进行知识元抽取,建立标准知识元数据库;
对所述标准知识元数据库中的多个标准知识元进行动态链接,并根据所述标准知识元数据库、所述知识搜索单元、所述语义分析单元及所述知识可视化单元构建标准知识服务模型。
3.根据权利要求2所述的方法,其特征在于,所述基于知识元抽取规则对所述标准文件进行知识元抽取,建立标准知识元数据库,包括:
对所述标准文件的内容进行解析,获取所述标准文件中的题录信息、适用范围、规范性引用文件、编码表信息及术语信息;
对所述题录信息、所述适用范围、所述规范性引用文件、所述编码表信息及所述术语信息分别进行信息抽取,获得题录知识元、适用范围知识元、引用文件知识元、编码知识元及术语知识元;
基于所述题录知识元、所述适用范围知识元、所述引用文件知识元、所述编码知识元及所述术语知识元建立标准知识元数据库。
4.根据权利要求1所述的方法,其特征在于,所述基于所述语义分析单元对查找到的标准文件进行标准主题、关联度和/或合作关系的分析,并通过所述知识可视化单元输出标准知识的可视化分析结果,包括:
基于所述语义分析单元对所述查找到的标准文件的文件名称或适用范围进行分析,获得各个标准文件对应的标准主题及各个标准主题的权重;
通过所述知识可视化单元的知识图谱对各个标准文件对应的标准主题及各个标准主题的权重进行可视化展示。
5.根据权利要求1所述的方法,其特征在于,所述基于所述语义分析单元对查找到的标准文件进行标准主题、关联度和/或合作关系的分析,并通过所述知识可视化单元输出标准知识的可视化分析结果,还包括:
获取所述查找到的标准文件的起草单位信息;
通过所述语义分析单元对所述查找到的标准文件的起草单位进行合作关系分析,获得各个起草单位的合作关系分析结果;
通过所述知识可视化单元的知识图谱对所述起草单位的合作关系分析结果进行可视化展示。
6.根据权利要求1所述的方法,其特征在于,所述基于所述语义分析单元对查找到的标准文件进行标准主题、关联度和/或合作关系的分析,并通过所述知识可视化单元输出标准知识的可视化分析结果,还包括:
获取所述查找到的标准文件的起草人信息;
通过所述语义分析单元对所述查找到的标准文件的起草人进行合作关系分析,获得各个起草人的合作关系分析结果;
通过所述知识可视化单元的知识图谱对所述起草人的合作关系分析结果进行可视化展示。
7.根据权利要求6所述的方法,其特征在于,通过所述语义分析单元对所述查找到的标准文件的起草人进行合作关系分析,获得各个起草人的合作关系分析结果,包括:
针对获取到的起草人信息,计算每个起草人在所述查找到的标准文件中出现的次数;
计算任意两个起草人在所述查找到的标准文件中的合作起草次数,其中,所述合作起草次数是指任意两个起草人同时出现在同一个标准文件的起草人信息中。
8.一种标准知识服务装置,其特征在于,包括:
接收模块,用于接收标准文件检索指令;
解析模块,用于解析所述标准文件检索指令,提取检索范围及检索关键字,其中,所述检索范围包括适用范围、术语、起草人、起草单位、引用标准、编码、标准文件的名称及标准文件的标准号;
文件查找模块,用于基于所述检索范围及所述检索关键字在所述标准知识服务模型的标准知识元数据库中查找对应的标准文件,其中,所述标准知识元数据库由多个标准知识元构建形成;
分析输出模块,用于基于所述标准知识服务模型对查找到的标准文件进行分析,输出标准知识分析结果,其中,所述标准知识服务模型包括知识搜索单元、语义分析单元及知识可视化单元;
其中,所述分析输出模块具体用于基于所述语义分析单元对查找到的标准文件进行标准主题、关联度和/或合作关系的分析,并通过所述知识可视化单元输出标准知识的可视化分析结果,其中,所述标准文件由所述标准知识服务模型的知识搜索单元在所述标准知识元数据库中查找获得;
所述分析输出模块,还用于:通过所述语义分析单元对各个标准文件对应的标准主题进行分析,并计算所述查找到的标准文件之间的主题相似度;通过所述语义分析单元对各个标准文件的引用标准进行分析,并计算所述查找到的标准文件之间的共引相似度;根据所述主题相似度及所述共引相似度计算所述查找到的标准文件之间的关联度;通过所述知识可视化单元的知识图谱对所述查找到的标准文件之间的关联度进行可视化展示。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当所述电子设备运行时,所述处理器与所述存储器之间通过所述总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1-7任一项所述的方法。
10.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110713030.7A CN113392072B (zh) | 2021-06-25 | 2021-06-25 | 标准知识服务方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110713030.7A CN113392072B (zh) | 2021-06-25 | 2021-06-25 | 标准知识服务方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113392072A CN113392072A (zh) | 2021-09-14 |
CN113392072B true CN113392072B (zh) | 2022-08-02 |
Family
ID=77623961
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110713030.7A Active CN113392072B (zh) | 2021-06-25 | 2021-06-25 | 标准知识服务方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113392072B (zh) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080133476A1 (en) * | 2006-12-05 | 2008-06-05 | Ivo Welch | Automated peer performance measurement system for academic citation databases |
CN101556606B (zh) * | 2009-05-20 | 2010-12-01 | 同方知网(北京)技术有限公司 | 一种基于Web数值表格抽取的数据挖掘方法 |
CN106372087B (zh) * | 2015-07-23 | 2019-12-13 | 北京大学 | 一种面向信息检索的信息地图生成方法及其动态更新方法 |
US10747759B2 (en) * | 2017-06-23 | 2020-08-18 | City University Of Hong Kong | System and method for conducting a textual data search |
CN111898366B (zh) * | 2020-07-29 | 2022-08-09 | 平安科技(深圳)有限公司 | 文献主题词聚合方法、装置、计算机设备及可读存储介质 |
CN112732945B (zh) * | 2021-03-30 | 2021-06-18 | 中国电子技术标准化研究院 | 标准知识图谱构建、标准查询方法及装置 |
-
2021
- 2021-06-25 CN CN202110713030.7A patent/CN113392072B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113392072A (zh) | 2021-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Carley et al. | AutoMap User's Guide 2013 | |
US7930322B2 (en) | Text based schema discovery and information extraction | |
Massey et al. | Automated text mining for requirements analysis of policy documents | |
US7840891B1 (en) | Method and system for content extraction from forms | |
CN107818815B (zh) | 电子病历的检索方法及系统 | |
CN105912645B (zh) | 一种智能问答方法及装置 | |
US9824088B2 (en) | Active knowledge guidance based on deep document analysis | |
CN108305180B (zh) | 一种好友推荐方法及装置 | |
CN112395395B (zh) | 文本关键词提取方法、装置、设备及存储介质 | |
CA3146606A1 (en) | Definition retrieval and display | |
US20220391426A1 (en) | Multi-system-based intelligent question answering method and apparatus, and device | |
CN112052414A (zh) | 一种数据处理方法、装置以及可读存储介质 | |
US7853595B2 (en) | Method and apparatus for creating a tool for generating an index for a document | |
Ribeiro et al. | Discovering IMRaD structure with different classifiers | |
KR20170043365A (ko) | 빅데이터를 이용한 중요 판례 추출 및 정리 방법 | |
Khemani et al. | A review on reddit news headlines with nltk tool | |
CN112632950A (zh) | Ppt生成方法、装置、设备及计算机可读存储介质 | |
CN113392072B (zh) | 标准知识服务方法、装置、电子设备和存储介质 | |
CN108733733B (zh) | 基于机器学习的生物医学文本分类方法、系统和存储介质 | |
CN113407678B (zh) | 知识图谱构建方法、装置和设备 | |
CN113268714B (zh) | 一种开源软件许可证条款自动提取方法 | |
CN114625658A (zh) | App稳定性测试方法、装置、设备和计算机可读存储介质 | |
CN107783957B (zh) | 本体创建方法和装置 | |
KR20020061443A (ko) | 컴퓨터 통신망을 이용한 정보의 수집, 가공 및 표시방법과 그 시스템 | |
Fonseca et al. | Representation of structured data of the text genre as a technique for automatic text processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |