CN109783598A - 信息资源的编目方法、装置、电子设备及存储介质 - Google Patents

信息资源的编目方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN109783598A
CN109783598A CN201811588566.5A CN201811588566A CN109783598A CN 109783598 A CN109783598 A CN 109783598A CN 201811588566 A CN201811588566 A CN 201811588566A CN 109783598 A CN109783598 A CN 109783598A
Authority
CN
China
Prior art keywords
information
resources
cataloguing
sample
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811588566.5A
Other languages
English (en)
Other versions
CN109783598B (zh
Inventor
谢东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dt Dream Technology Co Ltd
Original Assignee
Hangzhou Dt Dream Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dt Dream Technology Co Ltd filed Critical Hangzhou Dt Dream Technology Co Ltd
Priority to CN201811588566.5A priority Critical patent/CN109783598B/zh
Publication of CN109783598A publication Critical patent/CN109783598A/zh
Application granted granted Critical
Publication of CN109783598B publication Critical patent/CN109783598B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种信息资源的编目方法、装置、电子设备及存储介质,该方法包括获取待编目资源信息,并获取多个样本资源信息,其中,各样本资源信息以向量形式预先被存储,向量用于描述对应样本资源信息所包含的元素;将待编目资源信息分别与各样本资源信息对应的向量进行匹配;根据匹配得到的结果生成待编目资源信息对应的目录信息。通过本发明能够实现自动化地生成对待编目资源信息编目所需要的目录信息,提升目录信息生成的精准度,提升编目效果。

Description

信息资源的编目方法、装置、电子设备及存储介质
技术领域
本发明涉及编目技术领域,尤其涉及一种信息资源的编目方法、编目装置、电子设备及非临时性计算机可读存储介质。
背景技术
信息资源目录是通过对信息资源依据规范的元数据描述,按照一定的分类方法进行排序和编码的一组信息,用于描述各个信息资源的特征,以便于对信息资源的检索、定位与获取。信息资源目录是实现信息资源共享、业务协同和数据开放的基础,是各行业用户之间信息共享及部门数据向社会开放的依据。信息资源目录编制工作包括对行业信息资源的分类、元数据描述、代码规划和目录编制,以及相关工作的组织、流程、要求等方面的内容。
相关技术中的目录编制方式包括目录的在线注册及目录导入两种:在线注册:部门编目人员登录到目录管理系统,根据编目要求,在线手工录入信息资源的描述信息,并提交审核。目录导入:部门编目人员线下根据模板,填入对应的信息资源描述信息,模板一般支持填多个信息资源目录,然后登录到目录管理系统,手工导入根据模板填写的编目文档。
上述方式下,均需要目录编制人员逐条录入编制信息,而目录编制是个长期持续的任务,无疑添加了不少人力成本,信息资源的编目不够精准,编目效果不佳。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的目的在于提出一种信息资源的编目方法、装置、存储介质及电子设备,能够实现自动化地生成对待编目资源信息编目所需要的目录信息,提升目录信息生成的精准度,提升编目效果。
为达到上述目的,本发明第一方面实施例提出的信息资源的编目方法,包括:获取待编目资源信息,并获取多个样本资源信息,其中,各所述样本资源信息以向量形式预先被存储,所述向量用于描述对应样本资源信息所包含的元素;将所述待编目资源信息分别与各所述样本资源信息对应的向量进行匹配;根据匹配得到的结果生成所述待编目资源信息对应的目录信息。
本发明第一方面实施例提出的信息资源的编目方法,通过获取待编目资源信息,并获取多个样本资源信息,其中,各样本资源信息以向量形式预先被存储,向量用于描述对应样本资源信息所包含的元素,由于是将待编目资源信息分别与各样本资源信息对应的向量进行匹配;根据匹配得到的结果生成待编目资源信息对应的目录信息,能够实现自动化地生成对待编目资源信息编目所需要的目录信息,提升目录信息生成的精准度,提升编目效果。
为达到上述目的,本发明第二方面实施例提出的信息资源的编目装置,包括:获取模块,用于获取待编目资源信息,并获取多个样本资源信息,其中,各所述样本资源信息以向量形式预先被存储,所述向量用于描述对应样本资源信息所包含的元素;匹配模块,用于将所述待编目资源信息分别与各所述样本资源信息对应的向量进行匹配;生成模块,用于根据匹配得到的结果生成所述待编目资源信息对应的目录信息。
本发明第二方面实施例提出的信息资源的编目装置,通过获取待编目资源信息,并获取多个样本资源信息,其中,各样本资源信息以向量形式预先被存储,向量用于描述对应样本资源信息所包含的元素,由于是将待编目资源信息分别与各样本资源信息对应的向量进行匹配;根据匹配得到的结果生成待编目资源信息对应的目录信息,能够实现自动化地生成对待编目资源信息编目所需要的目录信息,提升目录信息生成的精准度,提升编目效果。
为达到上述目的,本发明第三方面实施例提出的非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器被执行时,使得移动终端能够执行一种信息资源的编目方法,所述方法包括:本发明第一方面实施例提出的信息资源的编目方法。
本发明第三方面实施例提出的非临时性计算机可读存储介质,通过获取待编目资源信息,并获取多个样本资源信息,其中,各样本资源信息以向量形式预先被存储,向量用于描述对应样本资源信息所包含的元素,由于是将待编目资源信息分别与各样本资源信息对应的向量进行匹配;根据匹配得到的结果生成待编目资源信息对应的目录信息,能够实现自动化地生成对待编目资源信息编目所需要的目录信息,提升目录信息生成的精准度,提升编目效果。
为达到上述目的,本发明第四方面实施例提出的计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行一种信息资源的编目方法,所述方法包括:获取待编目资源信息,并获取多个样本资源信息,其中,各所述样本资源信息以向量形式预先被存储,所述向量用于描述对应样本资源信息所包含的元素;将所述待编目资源信息分别与各所述样本资源信息对应的向量进行匹配;根据匹配得到的结果生成所述待编目资源信息对应的目录信息。
本发明第四方面实施例提出的计算机程序产品,通过获取待编目资源信息,并获取多个样本资源信息,其中,各样本资源信息以向量形式预先被存储,向量用于描述对应样本资源信息所包含的元素,由于是将待编目资源信息分别与各样本资源信息对应的向量进行匹配;根据匹配得到的结果生成待编目资源信息对应的目录信息,能够实现自动化地生成对待编目资源信息编目所需要的目录信息,提升目录信息生成的精准度,提升编目效果。
本发明第五方面还提出一种电子设备,该电子设备包括壳体、处理器、存储器、电路板和电源电路,其中,所述电路板安置在所述壳体围成的空间内部,所述处理器和所述存储器设置在所述电路板上;所述电源电路,用于为所述电子设备的各个电路或器件供电;所述存储器用于存储可执行程序代码;所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于执行:获取待编目资源信息,并获取多个样本资源信息,其中,各所述样本资源信息以向量形式预先被存储,所述向量用于描述对应样本资源信息所包含的元素;将所述待编目资源信息分别与各所述样本资源信息对应的向量进行匹配;根据匹配得到的结果生成所述待编目资源信息对应的目录信息。
本发明第五方面实施例提出的电子设备,通过获取待编目资源信息,并获取多个样本资源信息,其中,各样本资源信息以向量形式预先被存储,向量用于描述对应样本资源信息所包含的元素,由于是将待编目资源信息分别与各样本资源信息对应的向量进行匹配;根据匹配得到的结果生成待编目资源信息对应的目录信息,能够实现自动化地生成对待编目资源信息编目所需要的目录信息,提升目录信息生成的精准度,提升编目效果。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明一实施例提出的信息资源的编目方法的流程示意图;
图2为本发明实施例中待编目资源信息的获取途径示意图;
图3为本发明实施例中信息资源的编目系统的架构示意图;
图4为本发明实施例中进行向量匹配的流程示意图;
图5为本发明一实施例中部分所需信息的编目配置示意图;
图6为本发明另一实施例中部分所需信息的编目配置示意图;
图7为本发明另一实施例中部分所需信息的编目配置示意图;
图8为本发明另一实施例中部分所需信息的编目配置示意图;
图9为本发明实施例中目录信息的显示示意图;
图10为本发明实施例中目录信息回馈示意图;
图11是本发明一实施例提出的信息资源的编目装置的结构示意图;
图12是本发明另一实施例提出的信息资源的编目装置的结构示意图;
图13是本发明一个实施例提出的电子设备的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
图1是本发明一实施例提出的信息资源的编目方法的流程示意图。
本实施例以信息资源的编目方法被配置为信息资源的编目系统中来举例说明。
本实施例中信息资源的编目方法可以被配置在信息资源的编目系统中,信息资源的编目系统可以设置在服务器中,或者也可以设置在电子设备中,本申请实施例对此不作限制。
本实施例以信息资源的编目方法被配置在电子设备中为例。
需要说明的是,本申请实施例的执行主体,在硬件上可以例如为服务器或者电子设备中的中央处理器(Central Processing Unit,CPU),在软件上可以例如为服务器或者电子设备中的相关的后台服务,对此不作限制。
信息资源目录是通过对信息资源依据规范的元数据描述,按照一定的分类方法进行排序和编码的一组信息,用于描述各个信息资源的特征,以便于对信息资源的检索、定位与获取。信息资源目录是实现信息资源共享、业务协同和数据开放的基础,是各行业用户之间信息共享及部门数据向社会开放的依据。信息资源目录编制工作包括对行业信息资源的分类、元数据描述、代码规划和目录编制,以及相关工作的组织、流程、要求等方面的内容。
相关技术中的目录编制方式包括目录的在线注册及目录导入两种:在线注册:部门编目人员登录到目录管理系统,根据编目要求,在线手工录入信息资源的描述信息,并提交审核。目录导入:部门编目人员线下根据模板,填入对应的信息资源描述信息,模板一般支持填多个信息资源目录,然后登录到目录管理系统,手工导入根据模板填写的编目文档。
上述方式下,均需要目录编制人员逐条录入编制信息,而目录编制是个长期持续的任务,无疑添加了不少人力成本,信息资源的编目不够精准,编目效果不佳。
为了解决上述技术问题,本发明实施例中提供一种信息资源的编目方法,通过获取待编目资源信息,并获取多个样本资源信息,其中,各样本资源信息以向量形式预先被存储,向量用于描述对应样本资源信息所包含的元素,由于是将待编目资源信息分别与各样本资源信息对应的向量进行匹配;根据匹配得到的结果生成待编目资源信息对应的目录信息,能够实现自动化地生成对待编目资源信息编目所需要的目录信息,提升目录信息生成的精准度,提升编目效果。
参见图1,该方法包括:
S101:获取待编目资源信息,并获取多个样本资源信息,其中,各样本资源信息以向量形式预先被存储,向量用于描述对应样本资源信息所包含的元素。
其中,当前需要对其进行编目的信息资源可以被称为待编目资源,用于描述待编目资源的元素的信息,可以被称为待编目资源信息,该待编目资源信息以向量形式存在。
其中,在对待编目资源进行编目的过程中,可以作为参考的信息资源可以被称为样本资源,用于描述样本资源的元素的信息,可以被称为样本资源信息,该样本资源信息是以向量形式存在。
本发明实施例中的向量为计算机编程语言中的向量,其为一种数据存储结构。
其中的待编目资源信息包括:数据表信息、文件信息,以及调研表信息,其中,调研表信息用于描述各用户共享的资源信息以及生成编目需要获取的资源信息,样本资源信息包括:样本库信息、词库信息、标准数据元信息、标准表信息,以及标签信息,获取多个样本资源信息,包括:根据需要获取的资源信息,从样本库中获取样本资源信息。
本发明实施例在具体执行的过程中,可以从数据库、文件服务器,以及调研表中获取待编目资源信息,其中,参见图2,图2为本发明实施例中待编目资源信息的获取途径示意图,数据库作为承载用户信息资源最常见的存储形式,目录信息编制系统不定时地或根据配置(如每晚22点)获取数据库相比前一周期新增的数据表及表信息,包括表名、表结构字段及描述等元数据信息。文件服务器,作为承载用户非结构化数据的常见存储形式,典型如EXCEL文档、TXT文档、WORD文档、PDF文档等,目录信息编制系统不定时地或根据配置(如每晚22点)获取文件服务器相比前一周期新增的文件列表及对应的文件信息,包括表名、文档内容描述等信息。调研表,主要EXCEL文档、WORD文档来记录,描述各个用户可以共享的信息资源以及需要获取的信息资源,该信息资源的描述通常为模板化,且与目录信息编制所要求的各个描述吻合度较高。目录信息编制实现支持对此类EXCEL文档、WORD文档的导入、并自动识别。
通过配置待编目资源信息包括:数据表信息、文件信息,以及调研表信息,其中,调研表信息用于描述各用户共享的资源信息以及生成编目需要获取的资源信息,能够实现综合多方面的信息触发进行编目,有效提升编目精准度。
本发明实施例在具体执行的过程中,上述的样本资源信息以向量形式预先被存储,具体地,可以预先被存储在推荐服务子系统中,该推荐服务子系统可以为信息资源的编目系统中的一个子系统,参见图3,图3为本发明实施例中信息资源的编目系统的架构示意图。其中包括:推荐服务子系统30,针对每一种样本资源信息,设置对应的数据库,例如,针对样本库信息设置样本库31、针对词库信息设置词库32、针对标准数据元信息设置数据元对应的数据库33、针对标准表信息设置标准表库34,以及针对标签信息设置标签库35,其中,还可以在推荐服务子系统30中,设置样本库管理模块36,数据元管理模块37,词库管理模块38,表管理模块39,标签管理模块310,其中,样本库管理模块36,用于匹配出类似的编目推荐信息,作为不可缺少的功能组件。词库管理模块38用于匹配出完整、标准的行业术语,推荐使用,提供编目推荐的精确度。数据元管理模块37:用于关联匹配出行业标准的数据元信息,部分行业所需,根据行业选择是否需要。表管理模块39用于关联匹配出行业的标准表,部分行业所需,根据行业选择是否需要。标签管理模块310用于标识数据表所具备的特征,协助样本库提高推荐信息的精确度,推荐使用。
本发明实施例在具体执行的过程中,在获取待编目资源信息之后,还可以调用外部服务接口分别分解数据表信息、文件信息,以及调研表信息得到资源名称和字段,而后,可以将分解得到的资源名称和字段提供至推荐服务子系统30中,以使推荐服务子系统30将待编目资源信息分别与各样本资源信息对应的向量进行匹配。
其中,分解得到的资源名称可以例如为,提供数据表的表名称、部门名称、系统名称,文档名称等,分解得到的字段可以例如为,提供数据表的表结构信息、描述信息,描述、备注、文档内容等信息。
S102:将待编目资源信息分别与各样本资源信息对应的向量进行匹配。
本发明实施例在具体的执行过程中,将待编目资源信息分别与各样本资源信息对应的向量进行匹配,包括:将分解得到的资源名称,与词库信息对应的向量进行匹配,并根据匹配得到的结果生成标准化资源名称;根据标准化资源名称和标准化字段,从样本库信息和标签信息对应的向量中匹配出生成目录信息所需要的样本目录信息;根据样本目录信息,结合分解得到的字段和标准数据元信息对应的向量中匹配出标准化数据元;根据标准化数据元,从标准表信息对应的向量中匹配出标准数据表,并将标准化数据元与标准数据表进行关联。
作为一种示例,参见图4,图4为本发明实施例中进行向量匹配的流程示意图,其中,词库匹配,即将分解得到的资源名称,与词库信息对应的向量进行匹配,并根据匹配得到的结果生成标准化资源名称,是根据不同行业用户对于同类名称进行规范化,如“身份证信息”,存在sfzxx、sfx等不同的缩略,统一规范为“身份证信息”,该规范后的“身份证信息”即可以被称为标准化资源名称;样本库匹配,即根据标准化资源名称和标准化字段,从样本库信息和标签信息对应的向量中匹配出生成目录信息所需要的样本目录信息,根据行业的样本目录信息,如政务行业、公安行业等的样本目录信息;数据元关联,即根据样本目录信息,结合分解得到的字段和标准数据元信息对应的向量中匹配出标准化数据元,对于表的每个字段,匹配出标准化数据元,如“户籍”、“身份证信息”匹配用户的标准数据元;标准表关联,即根据标准化数据元,从标准表信息对应的向量中匹配出标准数据表,并将标准化数据元与标准数据表进行关联,对于表的每个字段,用于关联至标准数据表的每个字段,而后,触发根据匹配得到的结果生成待编目资源信息对应的目录信息。
S103:根据匹配得到的结果生成待编目资源信息对应的目录信息。
其中,可以将该生成的目录信息提供至相关技术中的编目系统中,以使相关技术中的编目系统基于该目录信息生成最终的目录。
本发明实施例在具体的执行过程中,根据上述所匹配得到的结果,具体地,可以根据标准化资源名称和标准化字段、所需要的样本目录信息,以及标准化数据元,与标准化数据元所关联的标准数据表自动生成对应的目录信息。
作为一种示例,信息资源的编目系统根据以上描述的词库、样本库、数据元信息、标准表信息等生成编目所需要的信息,部分所需信息参考某典型用户的编目配置图5,图6,图7和图8,图5为本发明一实施例中部分所需信息的编目配置示意图,图6为本发明另一实施例中部分所需信息的编目配置示意图,图7为本发明另一实施例中部分所需信息的编目配置示意图,图8为本发明另一实施例中部分所需信息的编目配置示意图,其中,“信息资源目录部门分类”“信息资源目录提供方”“信息资源目录提供方代码”由目录编制系统的部门信息转换生成;“信息资源目录名称”、“基础信息分类”、“主题信息分类”、“共享类型”、“共享方式”、“共享条件”、“开放类型”、“开放条件”、“信息资源目录摘要”根据样本库匹配计算生成;“信息资源目录代码”根据用户指定的代码规则自动生成;“原始信息资源格式”根据目录信息编制系统识别的格式类型提供;“信息项名称”根据数据元关联后匹配生成。
本发明实施例在具体执行的过程中,还可以将对应的目录信息提供至用户,并响应用户对对应的目录信息的确认。
参见图9,图9为本发明实施例中目录信息的显示示意图。根据推荐服务返回的目录信息,目录编制系统后台自动生成对应的目录信息,为区别与用户在线编目输入的,或者目录导入的目录信息,推荐服务生成的目录信息带有区别标识如“推”或“自”等。对于推荐的每一个编目需求,一般有多个推荐信息,用户可根据推荐信息的匹配相似度情况,支持结合实际情况做调整,如修改摘要信息,确定无误后完成提交,或者完成修改后保存、批量快速提交。
本发明实施例在具体执行的过程中,经由用户确认后提交的目录信息,还可以被回馈推荐服务系统,更新样本库向量、词库向量,用以提高后续编目推荐服务的推荐信息。参见图10,图10为本发明实施例中目录信息回馈示意图。
本发明实施例参考以上流程,以某部为例,日均产生150张数据表,系统能够自动完成150张数据表的推荐目录信息,用户对于每个编目投入时间平均10秒左右即可完成确认,批量完成所有编目的提交预估1分钟,只需不到半小时。大幅度减少目录编目人员的编目提交所需时间,以本发明实施例的示例,时间从1人天下降至半小时,提高目录信息的精确度。由于采用了推荐服务系统,自动计算数据资源大小以及采用标准的词库、数据元、数据表等,提高编目各个信息的精确度,减少人为可能的录入错误。
本实施例中,通过获取待编目资源信息,并获取多个样本资源信息,其中,各样本资源信息以向量形式预先被存储,向量用于描述对应样本资源信息所包含的元素,由于是将待编目资源信息分别与各样本资源信息对应的向量进行匹配;根据匹配得到的结果生成待编目资源信息对应的目录信息,能够实现自动化地生成对待编目资源信息编目所需要的目录信息,提升目录信息生成的精准度,提升编目效果。
图11是本发明一实施例提出的信息资源的编目装置的结构示意图。
参见图11,该装置110包括:
获取模块111,用于获取待编目资源信息,并获取多个样本资源信息,其中,各样本资源信息以向量形式预先被存储,向量用于描述对应样本资源信息所包含的元素;
匹配模块112,用于将待编目资源信息分别与各样本资源信息对应的向量进行匹配;
生成模块113,用于根据匹配得到的结果生成待编目资源信息对应的目录信息。
可选的,一些实施例中,待编目资源信息包括:数据表信息、文件信息,以及调研表信息,其中,调研表信息用于描述各用户共享的资源信息以及生成编目需要获取的资源信息,样本资源信息包括:样本库信息、词库信息、标准数据元信息、标准表信息,以及标签信息,获取模块111,具体用于:
根据需要获取的资源信息,从样本库中获取样本资源信息。
可选的,一些实施例中,参见图12,还包括:
分解模块114,用于调用外部服务接口分别分解数据表信息、文件信息,以及调研表信息得到资源名称和字段。
可选的,一些实施例中,匹配模块112,具体用于:
将分解得到的资源名称,与词库信息对应的向量进行匹配,并根据匹配得到的结果生成标准化资源名称;
根据标准化资源名称和标准化字段,从样本库信息和标签信息对应的向量中匹配出生成目录信息所需要的样本目录信息;
根据样本目录信息,结合分解得到的字段和标准数据元信息对应的向量中匹配出标准化数据元;
根据标准化数据元,从标准表信息对应的向量中匹配出标准数据表,并将标准化数据元与标准数据表进行关联。
可选的,一些实施例中,生成模块113,具体用于:
根据标准化资源名称和标准化字段、所需要的样本目录信息,以及标准化数据元,与标准化数据元所关联的标准数据表自动生成对应的目录信息。
可选的,一些实施例中,参见图12,还包括:
提供模块115,用于将对应的目录信息提供至用户,并响应用户对对应的目录信息的确认。
需要说明的是,前述图1-图10实施例中对信息资源的编目方法实施例的解释说明也适用于该实施例的信息资源的编目装置110,其实现原理类似,此处不再赘述。
本实施例中,通过获取待编目资源信息,并获取多个样本资源信息,其中,各样本资源信息以向量形式预先被存储,向量用于描述对应样本资源信息所包含的元素,由于是将待编目资源信息分别与各样本资源信息对应的向量进行匹配;根据匹配得到的结果生成待编目资源信息对应的目录信息,能够实现自动化地生成对待编目资源信息编目所需要的目录信息,提升目录信息生成的精准度,提升编目效果。
图13是本发明一个实施例提出的电子设备的结构示意图。
该电子设备可以是手机、平板电脑等。
参见图13,本实施例的电子设备130包括:壳体1301、处理器1302、存储器1303、电路板1304、电源电路1305,电路板1304安置在壳体1301围成的空间内部,处理器1302、存储器1303设置在电路板1304上;电源电路1305,用于为电子设备130各个电路或器件供电;存储器1303用于存储可执行程序代码;其中,处理器1302通过读取存储器1303中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行:
获取待编目资源信息,并获取多个样本资源信息,其中,各样本资源信息以向量形式预先被存储,向量用于描述对应样本资源信息所包含的元素;
将待编目资源信息分别与各样本资源信息对应的向量进行匹配;
根据匹配得到的结果生成待编目资源信息对应的目录信息。
需要说明的是,前述图1-图10实施例中对信息资源的编目方法实施例的解释说明也适用于该实施例的电子设备130,其实现原理类似,此处不再赘述。
本实施例中的电子设备,通过获取待编目资源信息,并获取多个样本资源信息,其中,各样本资源信息以向量形式预先被存储,向量用于描述对应样本资源信息所包含的元素,由于是将待编目资源信息分别与各样本资源信息对应的向量进行匹配;根据匹配得到的结果生成待编目资源信息对应的目录信息,能够实现自动化地生成对待编目资源信息编目所需要的目录信息,提升目录信息生成的精准度,提升编目效果。
为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,当存储介质中的指令由终端的处理器执行时,使得终端能够执行一种信息资源的编目方法,方法包括:
获取待编目资源信息,并获取多个样本资源信息,其中,各样本资源信息以向量形式预先被存储,向量用于描述对应样本资源信息所包含的元素;
将待编目资源信息分别与各样本资源信息对应的向量进行匹配;
根据匹配得到的结果生成待编目资源信息对应的目录信息。
本实施例中的非临时性计算机可读存储介质,通过获取待编目资源信息,并获取多个样本资源信息,其中,各样本资源信息以向量形式预先被存储,向量用于描述对应样本资源信息所包含的元素,由于是将待编目资源信息分别与各样本资源信息对应的向量进行匹配;根据匹配得到的结果生成待编目资源信息对应的目录信息,能够实现自动化地生成对待编目资源信息编目所需要的目录信息,提升目录信息生成的精准度,提升编目效果。
为了实现上述实施例,本发明还提出一种计算机程序产品,当计算机程序产品中的指令被处理器执行时,执行一种信息资源的编目方法,方法包括:
获取待编目资源信息,并获取多个样本资源信息,其中,各样本资源信息以向量形式预先被存储,向量用于描述对应样本资源信息所包含的元素;
将待编目资源信息分别与各样本资源信息对应的向量进行匹配;
根据匹配得到的结果生成待编目资源信息对应的目录信息。
本实施例中的计算机程序产品,通过获取待编目资源信息,并获取多个样本资源信息,其中,各样本资源信息以向量形式预先被存储,向量用于描述对应样本资源信息所包含的元素,由于是将待编目资源信息分别与各样本资源信息对应的向量进行匹配;根据匹配得到的结果生成待编目资源信息对应的目录信息,能够实现自动化地生成对待编目资源信息编目所需要的目录信息,提升目录信息生成的精准度,提升编目效果。
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种信息资源的编目方法,其特征在于,包括以下步骤:
获取待编目资源信息,并获取多个样本资源信息,其中,各所述样本资源信息以向量形式预先被存储,所述向量用于描述对应样本资源信息所包含的元素;
将所述待编目资源信息分别与各所述样本资源信息对应的向量进行匹配;
根据匹配得到的结果生成所述待编目资源信息对应的目录信息。
2.如权利要求1所述的信息资源的编目方法,其特征在于,所述待编目资源信息包括:数据表信息、文件信息,以及调研表信息,其中,所述调研表信息用于描述各用户共享的资源信息以及生成所述编目需要获取的资源信息,所述样本资源信息包括:样本库信息、词库信息、标准数据元信息、标准表信息,以及标签信息,所述获取多个样本资源信息,包括:
根据所述需要获取的资源信息,从样本库中获取所述样本资源信息。
3.如权利要求2所述的信息资源的编目方法,其特征在于,在所述获取待编目资源信息之后,还包括:
调用外部服务接口分别分解所述数据表信息、文件信息,以及调研表信息得到资源名称和字段。
4.如权利要求3所述的信息资源的编目方法,其特征在于,所述将所述待编目资源信息分别与各所述样本资源信息对应的向量进行匹配,包括:
将分解得到的所述资源名称,与所述词库信息对应的向量进行匹配,并根据匹配得到的结果生成标准化资源名称;
根据所述标准化资源名称和标准化字段,从所述样本库信息和所述标签信息对应的向量中匹配出生成所述目录信息所需要的样本目录信息;
根据所述样本目录信息,结合分解得到的所述字段和所述标准数据元信息对应的向量中匹配出标准化数据元;
根据所述标准化数据元,从所述标准表信息对应的向量中匹配出标准数据表,并将所述标准化数据元与所述标准数据表进行关联。
5.如权利要求4所述的信息资源的编目方法,其特征在于,所述根据匹配得到的结果生成所述待编目资源信息对应的目录信息,包括:
根据所述标准化资源名称和标准化字段、所需要的样本目录信息,以及所述标准化数据元,与所述标准化数据元所关联的标准数据表自动生成所述对应的目录信息。
6.如权利要求1-5任一项所述的信息资源的编目方法,其特征在于,还包括:
将所述对应的目录信息提供至用户,并响应所述用户对所述对应的目录信息的确认。
7.一种信息资源的编目装置,其特征在于,包括:
获取模块,用于获取待编目资源信息,并获取多个样本资源信息,其中,各所述样本资源信息以向量形式预先被存储,所述向量用于描述对应样本资源信息所包含的元素;
匹配模块,用于将所述待编目资源信息分别与各所述样本资源信息对应的向量进行匹配;
生成模块,用于根据匹配得到的结果生成所述待编目资源信息对应的目录信息。
8.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一项所述的信息资源的编目方法。
9.一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行一种信息资源的编目方法,所述方法包括:
获取待编目资源信息,并获取多个样本资源信息,其中,各所述样本资源信息以向量形式预先被存储,所述向量用于描述对应样本资源信息所包含的元素;
将所述待编目资源信息分别与各所述样本资源信息对应的向量进行匹配;
根据匹配得到的结果生成所述待编目资源信息对应的目录信息。
10.一种电子设备,包括壳体、处理器、存储器、电路板和电源电路,其中,所述电路板安置在所述壳体围成的空间内部,所述处理器和所述存储器设置在所述电路板上;所述电源电路,用于为所述电子设备的各个电路或器件供电;所述存储器用于存储可执行程序代码;所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于执行:
获取待编目资源信息,并获取多个样本资源信息,其中,各所述样本资源信息以向量形式预先被存储,所述向量用于描述对应样本资源信息所包含的元素;
将所述待编目资源信息分别与各所述样本资源信息对应的向量进行匹配;
根据匹配得到的结果生成所述待编目资源信息对应的目录信息。
CN201811588566.5A 2018-12-25 2018-12-25 信息资源的编目方法、装置、电子设备及存储介质 Active CN109783598B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811588566.5A CN109783598B (zh) 2018-12-25 2018-12-25 信息资源的编目方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811588566.5A CN109783598B (zh) 2018-12-25 2018-12-25 信息资源的编目方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN109783598A true CN109783598A (zh) 2019-05-21
CN109783598B CN109783598B (zh) 2021-02-12

Family

ID=66498097

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811588566.5A Active CN109783598B (zh) 2018-12-25 2018-12-25 信息资源的编目方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN109783598B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113515511A (zh) * 2021-05-28 2021-10-19 中国雄安集团数字城市科技有限公司 信息资源编目文件的数据清洗方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1393793A (zh) * 2001-06-22 2003-01-29 北京国之源软件技术有限公司 实现网络教学资源应用和更新的方法
US20060020630A1 (en) * 2004-07-23 2006-01-26 Stager Reed R Facial database methods and systems
CN105550219A (zh) * 2015-12-04 2016-05-04 航天科工智慧产业发展有限公司 一种信息资源的自动编目方法
CN107729557A (zh) * 2017-11-08 2018-02-23 北京大学 一种编目信息的分类、检索方法和装置
CN108228690A (zh) * 2017-06-30 2018-06-29 勤智数码科技股份有限公司 一种目录管理系统及其管理方法
CN108257043A (zh) * 2018-01-16 2018-07-06 航天科工智慧产业发展有限公司 一种政务信息资源梳理及目录管理系统和方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1393793A (zh) * 2001-06-22 2003-01-29 北京国之源软件技术有限公司 实现网络教学资源应用和更新的方法
US20060020630A1 (en) * 2004-07-23 2006-01-26 Stager Reed R Facial database methods and systems
CN105550219A (zh) * 2015-12-04 2016-05-04 航天科工智慧产业发展有限公司 一种信息资源的自动编目方法
CN108228690A (zh) * 2017-06-30 2018-06-29 勤智数码科技股份有限公司 一种目录管理系统及其管理方法
CN107729557A (zh) * 2017-11-08 2018-02-23 北京大学 一种编目信息的分类、检索方法和装置
CN108257043A (zh) * 2018-01-16 2018-07-06 航天科工智慧产业发展有限公司 一种政务信息资源梳理及目录管理系统和方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113515511A (zh) * 2021-05-28 2021-10-19 中国雄安集团数字城市科技有限公司 信息资源编目文件的数据清洗方法及装置
CN113515511B (zh) * 2021-05-28 2022-11-11 中国雄安集团数字城市科技有限公司 信息资源编目文件的数据清洗方法及装置

Also Published As

Publication number Publication date
CN109783598B (zh) 2021-02-12

Similar Documents

Publication Publication Date Title
Coustasse et al. Impact of radio-frequency identification (RFID) technologies on the hospital supply chain: a literature review
Karthikeyan et al. Cloud based emergency health care information service in India
CN103843031A (zh) 信息处理装置和方法以及程序
US20170011034A1 (en) Computerized system and method for automatically associating metadata with media objects
CN107609825A (zh) 一种物资仓库管理系统
CN104732154A (zh) 将数据匿名化的方法和系统
CN109785918B (zh) 一种应用于临床科研的数据采集系统及方法
US11756051B2 (en) System and method for custom-made medical devices life cycle management
CN111292817A (zh) 电子病历的生成方法及装置
CN109801690A (zh) 区域医疗电子病历共享整合查询系统及方法
CN108257031A (zh) 医疗保险产品发布方法、装置及存储介质
CN111785383A (zh) 数据处理方法及相关设备
CN110378561A (zh) 合同跟踪管理方法、装置及存储介质
CN110752027B (zh) 电子病历数据推送方法、装置、计算机设备和存储介质
Ali et al. A hybrid DevOps process supporting software reuse: A pilot project
CN108829668A (zh) 文本信息的生成方法、装置、计算机设备及存储介质
CN109299238B (zh) 一种数据查询方法和装置
Blobel et al. A model driven approach for the German health telematics architectural framework and security infrastructure
CN109783598A (zh) 信息资源的编目方法、装置、电子设备及存储介质
US20140325035A1 (en) Method and system of automated compliance management
CN112579787A (zh) 知识图谱的构建方法及装置
CN112530585A (zh) 基于医疗机构的数据处理方法、装置、计算机设备及介质
Ahmed et al. Design of a cost-effective customized Electronic Health Record system to handle patient management during Covid-19 pandemic
CN109801689A (zh) 区域医疗电子病历共享系统及方法
CN113724823B (zh) 医疗健康服务的线上管理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant