具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
为了清楚起见,首先说明本发明使用的特定词或短语的定义。
专业数据库:某一专业领域的数据库,如医学数据库、化学数据库等。
领域本体:是由众多的知识元及其之间的知识关联形成的知识网络。相比分类、关键词、主体词表,它更能够准确地描述专业领域内的知识框架。
图1为本发明专业数据库的构建方法实施例一的流程图,如图1所示,本实施例提供的专业数据库的构建方法的执行主体为专业数据库的构建装置,该专业数据库的构建装置可集成在计算机、服务器等之中。则本实施例提供的专业数据库的构建方法包括以下几个步骤。
步骤101,创建目标专业数据库。
具体的,本实施例中,创建的目标专业数据库为新的专业数据库,可为该目标专业数据库设置基本属性,如名称、领域、编号等,该目标专业数据库的名称、编号可作为该目标专业数据库的标识信息。
步骤102,将目标专业数据库对应的邻域本体添加到目标专业数据库中,以作为目标数据库的知识组织体系。
本实施例中,预先构建了目标专业数据库对应的邻域本体。该领域本体由众多的知识元及其之间的知识关联形成的知识网络。如该邻域本体为兽医领域的邻域本体。则该邻域本体中的知识元可包括:疾病、兽药标准、药厂、药品、药物及专家等。该领域本体将疾病、兽药标准、药厂、药品、药物及专家进行了知识关联,并可以图谱的形式进行展现。
具体地,本实施例中,将目标专业数据库对应的邻域本体添加到目标专业数据库中,以作为目标数据库的知识组织体系,能够将各知识元进行更好的知识关联。
步骤103,获取多个知识条目。
具体地,本实施例中,可将知识条目预先存储到资源库中,若在资源库中出现了新增的多个知识条目,则获取该多个知识条目。
该知识条目可以为一篇文章、一段文字或一句话等。本实施例中,以XML的格式对知识条目进行表示。
步骤104,建立各知识条目与邻域本体中的知识元的关联关系。
具体地,本实施例中,建立各知识条目与邻域本体中的知识元的关联关系的方法可以为:将知识条目的关键词与邻域本体中的知识元进行匹配,若关键词与知识元相匹配,则建立该关键词对应的知识条目与知识元的关联关系。也可通过其他方式建立各知识条目与邻域本体中的知识元的关联关系,本实施例中对此不做限定。
步骤105,建立知识条目和目标专业数据库的数据索引。
其中,知识条目和目标专业数据库的数据索引即为知识条目与目标专业数据库的对应关系。可根据各知识条目与邻域本体中的知识元的关联关系确定各知识条目和目标专业数据库的数据索引。
本实施例提供的专业数据库的构建方法,通过创建目标专业数据库;将目标专业数据库对应的邻域本体添加到目标专业数据库中,以作为目标数据库的知识组织体系;获取多个知识条目;建立各知识条目与邻域本体中的知识元的关联关系;建立知识条目和目标专业数据库的数据索引。由于邻域本体能够提供更准确和完善的数据的关联关系,所以以邻域本体作为专业数据库的知识组织体系,并建立各知识条目与邻域本体中知识元的关联关系,能够使整个专业数据库中各资源的关联关系更加完整,使资源内容更加全面,并使推荐和检索结果更加完善。并实现了专业数据库的自动化构建,减少了构建时间。
图2为本发明专业数据库的构建方法实施例二的流程图,如图2所示,本实施例提供的专业数据库的构建方法,是在本发明专业数据库的构建方法实施例一的基础上,对步骤104-步骤105的进一步细化,还包括了对关联关系和数据索引的调整步骤。则本实施例提供的专业数据库的构建方法包括以下步骤。
步骤201,创建目标专业数据库。
步骤202,将目标专业数据库对应的邻域本体添加到目标专业数据库中,以作为目标数据库的知识组织体系。
步骤203,获取多个知识条目。
本实施例中,步骤201-步骤203的实现方式与本发明专业数据库的构建方法实施例一中的步骤101-步骤103的实现方式相同,在此不再一一赘述。
步骤204,建立各知识条目与邻域本体中的知识元的关联关系。
进一步地,本实施例中,建立各知识条目与邻域本体中的知识元的关联关系具体包括:
首先,将各知识条目进行分词处理。
具体地,本实施例中,对分词的处理的方法不做限定,如可以为:基于字符串匹配的分词方法、基于理解的分词方法或基于统计的分词方法等。
其次,统计分词处理后的每个知识条目中的各分词的属性参数。
其中,分词的属性参数可包括以下任意一种或多种:词性、位置、频率、权重。还可包括其他属性参数,本实施例中对此不做限定。
再次,根据各分词的属性参数对每个知识条目中的各分词进行排序。
具体地,若分词的属性参数为一个,则按照该属性参数对每个知识条目中的各分词进行排序。若分词的属性参数为多个,则对这多个属性参数设置权值,结合这多个属性参数对每个知识条目中的各分词进行排序。
然后,获取排在前预设个数的分词,并与邻域本体中的知识元进行匹配。
其中,预设个数可表示为N,N的数值不做限定。
将预设个数的分词与邻域本体中的知识元进行匹配时,若知识元包含该分词,或者知识元与该分词相同或相似,则确定该分词与该邻域本体中的知识元相匹配。
最后,将每个知识条目与相匹配的知识元进行关联。
通过排在前预设个数的分词与邻域本体中的知识元进行匹配的方法确定与每个知识条目相匹配的知识元,可使每个知识条目与一个或多个知识元相匹配,则将每个知识条目与一个或多个相匹配的知识元进行关联。
本实施例中,将每个知识条目与相匹配的知识元进行关联后,将每个知识条目与相匹配的知识元的关联关系进行存储。
步骤205,输出各知识条目与邻域本体中的知识元的关联关系。
具体地,可通过显示屏向用户输出各知识条目与邻域本体中的知识元的关联关系,用户可对各知识条目与邻域本体中的知识元的关联关系进行查看,也可对某一个或多个知识条目与邻域本体中的知识元的关联关系进行调整。
步骤206,判断是否接收到关联关系调整指令,若是,则执行步骤207,否则,执行步骤208。
其中,关联关系调整指令中携带知识条目的标识信息以及知识元的标识信息。
进一步地,本实施例中,关联关系调整指令可以为删除、增加关联关系。
步骤207,根据关联关系调整指令,调整知识条目的标识信息以及知识元的标识信息对应的知识条目与知识元的关联关系。
具体地,本实施例中,若关联关系调整指令为关联关系删除指令,则删除知识条目的标识信息以及知识元的标识信息对应的知识条目与知识元的关联关系。若关联关系调整指令为关联关系增加指令,则增加知识条目的标识信息以及知识元的标识信息对应的知识条目与知识元的关联关系。
步骤208,建立知识条目和目标专业数据库的数据索引。
本实施例中,步骤208的实现方式与本发明专业数据库的构建方法实施例一中步骤105的实现方式相同,在此不再一一赘述。
步骤209,判断是否接收到数据索引调整指令,若是,则执行步骤210,否则,结束。
其中,数据索引调整指令中携带知识条目的标识信息及目标数据库的标识信息。
步骤210,根据数据索引调整指令,调整知识条目的标识信息及目标数据库的标识信息对应的数据索引。
进一步地,结合步骤209-步骤210进行说明。若用户需要对数据索引进行调整,则通过专业数据库的构建装置发送数据索引调整指令,若专业数据库的构建装置接收到数据索引调整指令,则根据数据索引调整指令,调整知识条目的标识信息及目标数据库的标识信息对应的数据索引。
其中,数据索引调整指令包括:数据索引删除指令、数据索引增加指令。若数据索引调整指令为数据索引删除指令,则根据数据索引调整指令,删除知识条目的标识信息及目标数据库的标识信息对应的数据索引。若数据索引调整指令为数据索引增加指令,则根据数据索引调整指令,增加知识条目的标识信息及目标数据库的标识信息对应的数据索引。
本实施例提供的专业数据库的构建方法,通过创建目标专业数据库,将目标专业数据库对应的邻域本体添加到目标专业数据库中,以作为目标数据库的知识组织体系,获取多个知识条目,建立各知识条目与邻域本体中的知识元的关联关系,输出各知识条目与邻域本体中的知识元的关联关系,判断是否接收到关联关系调整指令,若是,则根据关联关系调整指令,调整知识条目的标识信息以及知识元的标识信息对应的知识条目与知识元的关联关系,建立知识条目和目标专业数据库的数据索引,判断是否接收到数据索引调整指令,若是,则根据数据索引调整指令,调整知识条目的标识信息及目标数据库的标识信息对应的数据索引,不仅能够使整个专业数据库中各资源的关联关系更加完整,使资源内容更加全面,推荐和检索结果更加完善,而且能够对关联关系和数据索引进行调整和更新,使专业数据库更能满足需求。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
图3为本发明专业数据库的构建装置实施例一的结构示意图,如图3所示,本实施例提供的专业数据库的构建装置包括:数据库创建模块31,邻域本体添加模块32,知识条目获取模块33,关联关系建立模块34,数据索引建立模块35。
其中,数据库创建模块31,用于创建目标专业数据库。邻域本体添加模块32,用于将目标专业数据库对应的邻域本体添加到目标专业数据库中,以作为目标数据库的知识组织体系。知识条目获取模块33,用于获取多个知识条目。关联关系建立模块34,用于建立各知识条目与邻域本体中的知识元的关联关系。数据索引建立模块35,用于建立知识条目和目标专业数据库的数据索引。
本实施例提供的专业数据库的构建装置可以执行图1所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图4为本发明专业数据库的构建装置实施例二的结构示意图,如图4所示,本实施例提供的专业数据库的构建装置在本发明专业数据库的构建装置实施例一的基础上,进一步地,还包括:关联关系输出模块41,关联关系调整指令接收模块42,关联关系调整模块43,数据索引调整指令接收模块44,数据索引调整模块45。
进一步地,关联关系建立模块34,具体用于:将各知识条目进行分词处理;统计分词处理后的每个知识条目中的各分词的属性参数;根据各分词的属性参数对每个知识条目中的各分词进行排序;获取排在前预设个数的分词,并与邻域本体中的知识元进行匹配;将每个知识条目与相匹配的知识元进行关联。
进一步地,关联关系输出模块41,用于输出各知识条目与邻域本体中的知识元的关联关系。关联关系调整指令接收模块42,用于接收关联关系调整指令,调整指令中携带知识条目的标识信息以及知识元的标识信息。关联关系调整模块43,用于根据关联关系调整指令,调整知识条目的标识信息以及知识元的标识信息对应的知识条目与知识元的关联关系。
进一步地,数据索引调整指令接收模块44,用于接收数据索引调整指令,数据索引调整指令中携带知识条目的标识信息及目标数据库的标识信息。数据索引调整模块45,用于根据数据索引调整指令,调整知识条目的标识信息及目标数据库的标识信息对应的数据索引。
本实施例提供的专业数据库的构建装置可以执行图2所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。