CN102880720B - 信息资源管理及语义检索方法 - Google Patents

信息资源管理及语义检索方法 Download PDF

Info

Publication number
CN102880720B
CN102880720B CN201210390376.9A CN201210390376A CN102880720B CN 102880720 B CN102880720 B CN 102880720B CN 201210390376 A CN201210390376 A CN 201210390376A CN 102880720 B CN102880720 B CN 102880720B
Authority
CN
China
Prior art keywords
catalogue
information
attribute
directory
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210390376.9A
Other languages
English (en)
Other versions
CN102880720A (zh
Inventor
刘超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201210390376.9A priority Critical patent/CN102880720B/zh
Publication of CN102880720A publication Critical patent/CN102880720A/zh
Application granted granted Critical
Publication of CN102880720B publication Critical patent/CN102880720B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种资源信息的管理方法及系统,包括:创建或利用属性信息库中的属性信息,所述属性信息包括属性的语义描述信息及分类和检索过程中使用的语义逻辑关系信息;根据属性信息库中的属性信息创建资源库和目录库,所述资源库中用于保存需要管理的信息资源对应的资源标识信息及信息资源在属性信息库中对应的引用的语义逻辑关系信息,所述目录库中用于保存用户创建的目录对应的目录标识信息及目录在属性信息库中对应的引用的语义逻辑关系信息。本发明通过分离语义信息与语义逻辑关系信息实现了对私密信息的保护,结合语义逻辑关系信息的结构化处理优化了语义搜索算法,提高了检索效率;再结合对公共属性的综合处理,实现了跨语言的语义检索。

Description

信息资源管理及语义检索方法
技术领域
本发明涉及一种信息资源的分类管理及检索技术,尤其涉及一种信息资源的智能化管理方法及系统。
背景技术
随着电子技术及信息技术的快速发展,电子设备中需要管理的资源信息也越来越多。这就对资源信息的合理管理提出了更高的要求。
目前,在电子设备中,通常采用树状目录存储显示结构进行资源信息的管理。树状目录下的每个目录(根目录除外)都仅有一个直接父目录。如图1所示,相应的树状目录的存储根据目录节点的从属关系使用链表方式实现。
从图1所示的基于树状目录的资源信息管理方式可以看出,其具有以下缺点:
假设有如下文件类型的信息资源需要分类管理:
从专业方向分:社会科学(经济学,哲学),自然科学(数学,物理学);
从文件类型分:期刊(权威类期刊,一般期刊),图书(专著,汇编);
从语言上分:中文(简体,繁体),外文(英文,日文);
此时,若采用图1所示的信息资源管理方式,则对于某一文件,只能将其放置于某一目录下,其对应的父目录只有一个。如果想建立一些交叉学科的目录(或资源),比如建立一个包含经济学与哲学领域目录(比如经济哲学)或数学与哲学(数学哲学)的目录或者想建立三个目录(数学目录,期刊目录,数学期刊目录)等,则图1提供的目录树中是无法实现的。
为了解决上述问题,有些工程实践采用文件复制的方式或者建立快捷方式的方法,但是,该方法不能维护资源间的一致性,当删除(或修改)资源时,需要把所有备份信息同时删除(或修改),因而缺乏一种高效的方法进行智能化处理。
再者,假设“中文\繁体”目录下面有一个文件:“深入浅出MFC.pdf”,则该文件只有在“中文\繁体”目录下才可以看见,而“中文”目录或者“图书”目录下均无法看到,这不符合自然语言中对于资源分类的理解,在自然语言中,通常的逻辑是:如果“深入浅出MFC.pdf”是一个繁体图书,那么“深入浅出MFC.pdf”也一定属于“中文”目录和“图书”目录。
近年来,理论界中也出现了语义目录的概念,试图处理多个上级目录问题,但是,当目录比较多时,依然缺少一种实用的工程方法及能够在有限的空间内展示目录关系的技术手段。
概念格理论也称为形式概念分析,是由Wille教授于20世纪80年代提出的一种概念表示模型,它客观地反映了人类自然语言的概念间的语义逻辑关系,即一个概念可能拥有多个上级父概念(比如白马是分别是白色与马的概念的子概念),概念码理论在概念格理论的基础之上(刘超,王文杰.基于可能世界的网构软件之自动推理研究,计算机工程与设计,2011年4月:1401-1405)进行了优化处理,对每个概念给出一个三进制编码(概念码),并用概念码之间的偏序关系反映概念之间的语义关系。然而,概念码理论是基于三值逻辑的,依然缺乏一种实用的工程化方法。利用本体技术进行资源分类是另一种技术实现方式(如一种使用本体进行文本文档自动分类的方法,CN 101944099 B,基于形式概念分析的遥感信息处理服务分类本体构建方法,CN 101699444 B),但是这方面的现有技术都缺乏有关目录与资源的概念上的严格区分,相似度本身也缺乏一种与自然语言相一致的直观体验,即在自然语言中,一个对象是否属于某个概念,其结果是确定的。
在生活中,大多数名词概念具有一种为公众所共知的内涵,这是一种客观事实,除此之外,每个人都可以建立自己的概念分类体系,虽然这些概念本身是主观的,但是,承认每个人可以应用自己的主观概念和同自己进行交流,这种认识本身是客观的。以上两种客观性需要一种技术手段来帮助人们挖掘概念背后的语义关系。谓词逻辑一种常见的技术手段,然而,谓词逻辑除了理论上存在不可判定性之外,其工作效率也是低下的;同时,针对用户私人建立的主观概念,当利用第三方提供的服务时,用户也希望保护自己的隐私,比如说,在通讯录中建立分组时,有亲人组(家人,老舅,老妹等),当用户使用服务器协助检索时,用户往往并不希望把分组的名称等信息传递到服务器。
以上讨论中提出的问题或者在理论上存在障碍,或者缺少实用的工程化方法,目前尚没有相应问题的工程化解决方案。
发明内容
本发明的目的是提供一种信息资源的智能化管理方法,从而便于对网络及电子设备中的资源信息的有效管理。
本发明的目的是通过以下技术方案实现的:
一种信息资源的智能化管理方法,包括:
创建或利用属性信息库中的属性信息,所述属性信息包括属性的语义描述信息和属性的语义逻辑关系信息,所述的语义逻辑关系信息可在及分类和检索过程中使用;
根据属性信息库中的属性信息创建资源库和目录库,所述资源库中用于保存需要管理的信息资源对应的资源标识信息及信息资源在属性信息库中对应的引用的语义逻辑关系信息,所述目录库中用于保存用户创建的目录对应的目录标识信息及目录在属性信息库中对应的引用的语义逻辑关系信息;
根据信息资源在属性信息库中对应引用的语义逻辑关系信息及目录在属性信息库中对应引用的语义逻辑关系信息,对资源库和目录库中的内容进行语义检索。
该方法还包括:
建立非私密的资源库和非私密的目录库,所述非私密的资源库包含或不包含信息资源的语义描述信息,所述非私密的目录库包含或不包含目录的语义描述信息;
若多个用户创建的非私密资源库及非私密目录库放在同一个实体设备中,则需要增加一个描述资源库或目录库或属性信息库和用户之间的关联关系的用户信息库,通过所述用户信息库能够识别所述非私密资源库或非私密目录库所隶属的用户;
当委托第三方服务器完成检索服务时,第三方服务器可以通过所述非私密资源库和非私密目录库完成语义检索。
所述属性信息库、资源库和目录库为一个或多个用户所创建,并保存在相同或不同的联网实体设备中,若多个用户创建的资源库或目录库或属性信息库放在同一个实体设备中,则需要增加一个描述资源库或目录库或属性信息库和用户之间的关联关系的用户信息库,通过所述用户信息库能够识别所述资源库或目录库或属性信息库所属的用户。
所述属性信息库包括:
至少一个公共属性,以及零个或一个或多个私人属性;或者,至少一个私人属性,以及零个或一个或多个公共属性;
所述的公共属性及私人属性分别采用属性值描述属性的语义描述信息,属性值编码描述属性的语义逻辑关系信息;
所述的公共属性是指由系统设定的不可被用户自由修改的属性;
所述的私人属性是指由创建者自己解释应用的属性;
所述的语义逻辑关系是指概念在语义上的包含、不包含、部分包含或者部分不包含关系;
所述公共属性包括资源管理的公共属性,若资源库中具有两种或两种以上操作方式的信息资源,则属性信息库中至少包含一个用于描述信息资源的运行或使用方式的属性信息。
所述属性信息库中的属性的属性值编码是一种二进制编码或字符串编码,所述二进制编码或字符串编码把属性值上的语义关系转换为数学上的值或字符串模式匹配上的偏序关系;
目录库中各个目录在属性信息库中引用的属性值标识及属性值编码确定了目录的目录码;
资源库中各个资源在属性信息库中引用的属性值标识及属性值编码确定了资源的资源码;
所述目录码及属性码可以用于计算目录与目录之间,目录与资源之间的语义逻辑关系;
在目录的浏览或资源检索过程中,是针对资源库中的资源码及目录库中的目录码进行关系比较查询实现的。
该方法还包括:
当用户利用自己的目录库去检索其他用户创建的资源库时,所应用的资源码及目录码中的有效部分只来自所述公共属性,且所述的检索过程由用户直接完成或委托第三方服务器完成。
所述属性信息库中还包括:
属性的默认属性值标记和属性值的目录自动组合标记,以及由属性的默认属性值及具有目录自动组合标记的属性值组成的自动组合目录的属性值集合,其中,根据每个属性对应的自动组合目录的属性值集合,采用集合元素组合的方式生成目录。
该方法还包括目录浏览操作及显示返回结果的图形用户界面,包括:
当确定当前选中目录后,在目录库中确定当前选中目录的父目录或直接父目录、兄弟目录、子目录或直接子目录及其包含的信息资源,其中,所述父目录或直接父目录、子目录或直接子目录都可以为零个或一个或多个;
在显示界面中设置的父目录区显示当前选中目录的父目录或直接父目录;
在显示界面中设置的兄弟目录区显示当前选中目录和当前选中目录的兄弟目录;
在显示界面中设置的子目录区显示当前选中目录的子目录或直接子目录;
以及在显示界面中设置的资源区显示当前选中目录下的信息资源。
一种信息资源的智能化管理系统,包括:
客户端界面交互处理模块,用于收集用户管理及检索操作命令,并返回操作结果;
客户端管理模块,根据用户命令管理本地信息存储模块;
本地信息存储模块,用于存储用户的属性信息库、资源库和目录库,其中,所述的属性信息库,用于保存属性信息,所述属性信息包括属性的语义描述信息和属性的语义逻辑关系信息,所述的语义逻辑关系信息可在及分类和检索过程中使用,所述的资源库,根据所述属性信息库中的属性信息创建,用于保存需要管理的信息资源对应的资源标识信息及信息资源在属性信息库中对应的引用的语义逻辑关系信息;所述的目录库,根据所述属性信息库中的属性信息创建,用于保存用户创建的目录对应的目录标识信息及目录在属性信息库中对应的引用的语义逻辑关系信息。
该系统还可以包括:
公共信息存储模块,公共信息管理模块,及非私密的资源库和非私密的目录库;
所述非私密的资源库包含或不包含信息资源的语义描述信息,所述非私密的目录库包含或不包含目录的语义描述信息;
所述非私密资源库和非私密目录库可以存储于或者临时存储于公共信息存储模块,并由公共信息管理模块管理及检索分析;
若有多个用户创建的非私密资源库及非私密目录库放在同一个公共信息存储模块中,则需要增加一个描述资源库或目录库或属性信息库和用户之间的关联关系的用户信息库,通过所述用户信息库能够识别所述非私密资源库或非私密目录库所隶属的用户;
所述公共信息管理模块可以和客户端管理模块通信并接受客户端管理模块的委托完成管理公共信息存储模块的信息资源;
所述客户端管理模块可以根据用户命令管理本地信息存储模块,和/或,委托公共信息管理模块检索公共信息存储模块。
该系统还包括:
多个分布于网络的客户端界面交互处理模块,多个客户端管理模块,以及多个本地信息存储模块;
若多个用户创建的本地信息存储模块存放在同一个实体设备中,则需要增加一个描述资源库或目录库或属性信息库和用户之间的关联关系的用户信息库,通过所述用户信息库能够识别所述资源库或目录库或属性信息库所属的用户。
所述属性信息库包括:
至少一个公共属性,以及零个或一个或多个私人属性;或者,至少一个私人属性,以及零个或一个或多个公共属性;
所述的公共属性及私人属性分别采用属性值描述属性的语义描述信息,属性值编码描述属性的语义逻辑关系信息;
所述的公共属性是指由系统设定的不可被用户自由修改的属性;
所述的私人属性是指由创建者自己的解释应用的属性;
所述的语义逻辑关系是指概念在语义上的包含、不包含、部分包含或者部分不包含关系;
所述公共属性包括资源管理的公共属性,若资源库中具有两种或两种以上操作方式的信息资源,则属性信息库中至少包含一个用于描述信息资源的运行或使用方式的属性信息。
所述属性信息库中的属性的属性值编码是一种二进制编码或字符串编码,所述二进制编码或字符串编码把属性值上的语义关系转换为数学上的值或字符串模式匹配上的偏序关系;
目录库中各个目录在属性信息库中引用的属性值标识及属性值编码确定了目录的目录码;
资源库中各个资源在属性信息库中引用的属性值标识及属性值编码确定了资源的资源码;
所述目录码及属性码可以用于计算目录与目录之间,目录与资源之间的语义逻辑关系;
在目录的浏览或资源检索过程中,是针对资源库中的资源码及目录库中的目录码进行关系比较查询实现的。
多个服务器端管理模块,用于与客户端管理模块通信并接受客户端管理模块的委托完成管理操作;
所述服务器端管理模块以公共属性为基础对本地信息存储模块进行检索或委托其他服务器端管理模块完成检索或者同时综合处理两种检索结果;
所述客户端管理模块可以根据用户命令管理本地信息存储模块或者委托网络信息检索模块检索公共信息存储模块或者同时综合处理两种检索结果,所述根据用户命令管理本地信息存储模块包括检索本地信息存储模块。
所述客户端界面交互处理模块可以接受用户的管理命令及目录浏览操作并显示返回结果,所述管理包括目录,资源,及私人属性的增加,修改及删除操作,所述的目录浏览包括:
当确定当前选中目录后,在目录库中确定当前选中目录的父目录或直接父目录、兄弟目录、子目录或直接子目录及其包含的信息资源,其中,所述父目录或直接父目录、子目录或直接子目录都可以为零个或一个或多个;
在显示界面中设置的父目录区显示当前选中目录的父目录或直接父目录;
在显示界面中设置的兄弟目录区显示当前选中目录和当前选中目录的兄弟目录;
在显示界面中设置的子目录区显示当前选中目录的子目录或直接子目录;
以及在显示界面中设置的资源区显示当前选中目录下的信息资源。
由上述本发明提供的技术方案可以看出,本发明实施例的实现使得在目录显示界面中能够同时显示一个选中目录的多个父目录且资源与目录之间的隶属关系是一种符合自然语言的隶属关系,从而令资源信息显示符合自然语言习惯。同时,还提供一种方便的资源分类方法及资源语义搜索算法,提高了搜索处理的效率。另外,本发明实施例中,利用公共属性操作资源值,从而屏蔽了资源自身的语言特性;同时,在利用第三方服务器(网络服务器)提供的本地资源搜索服务时,还可以充分保护用户的隐私权。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为现有技术提供的资源管理实现方式的树状目录示意图;
图2为本发明实施例提供的处理过程示意图;
图3为本发明实施例提供的目录结构示意图一;
图4为本发明实施例提供的科目属性中属性值语义分布结构示意图;
图5为本发明实施例提供的文件类型属性中属性值语义分布结构示意图;
图6为本发明实施例提供的语言类型属性中属性值语义分布结构示意图;
图7为本发明实施例提供的使用方式类型属性中属性值语义分布结构示意图;
图8为本发明实施例提供的目录显示界面示意图一;
图9为本发明实施例提供的目录显示界面示意图二;
图10为本发明实施例提供的目录显示界面示意图三;
图11为本发明实施例提供的目录显示界面示意图四;
图12为本发明实施例提供的目录显示界面示意图五;
图13为本发明实施例提供的单一客户端系统结构示意图。
图14为本发明实施例提供的保护用户私密的搜索服务的系统结构示意图。
图15为本发明实施例提供的多客户端网络搜索服务的系统结构示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
下面将结合附图对本发明实施例作进一步地详细描述。
本发明实施例提供了一种信息资源的智能化管理方法,如图2所示,可以包括:
步骤21,创建或利用属性信息库中的属性信息(如果属性信息库已经创建,则可以直接利用,否则,则可以在该步骤中创建相应的属性信息库),即获取属性信息库中的属性信息,所述属性信息包括属性的语义描述信息及分类和检索过程中使用的语义逻辑关系信息;相应的属性是指信息资源及用户创建的目录所使用的分类特性,例如,资源的语言分类属性、文献来源属性、学科分类属性、生物分类属性、功能分类属性等等;
在属性信息库中具体可以采用属性值描述属性的语义描述信息,采用属性值编码描述属性的语义逻辑关系信息;
例如,对于语言分类属性,进一步还可以分为中文和外文,中文又可以分为简体和繁体,外文又可进一步分为英文,日文,相应地中文、简体、繁体、外文、英文和日文便是语言分类属性的六个具体的属性值,另外,考虑到建立目录的时候,会有一个任意语言都可以的属性值,即任意值,还有一个不使用任何可知语言的属性值,比如用图画的方式表现的,即空值,在加上一个有语言分类属性值或者无语言分类属性值都可以的根值,即语言分类属性总计有九个属性值;再比如,资源的文献来源属性进一步可以分为期刊和图书,期刊又可以分为权威期刊和一般期刊,图书又可以分为汇编类和专著类,则相应地期刊、权威期刊、一般期刊、图书、汇编图书和专著便是文献来源属性的六个具体的属性值,再加上任意值,空值,根值,即文献来源属性总计有九个属性值;同时,任意值,空值,根值作为三个通用的属性值,是否使用可以视情况而定;
对于属性值编码,则可以由用户直接给出属性值的属性值编码;或者,也可以仅仅给出属性上所有属性值之间的语义关系,之后由系统根据属性值之间的语义逻辑关系计算出属性值的属性值编码,例如,可以参照现有技术中给出的计算概念码的方法,计算每个属性值在一个属性上的属性值编码,并可以进一步将属性值编码转换为期望的编码形式(如二进制编码或字符串编码);
具体地,如果系统需要处理多种具有不同操作方式的信息资源,则在相应的属性信息库中还可以至少包含一个用于描述信息资源的运行或使用方式的属性信息。
步骤22,根据属性信息库中的属性信息创建资源库和目录库,所述资源库中用于保存需要管理的信息资源对应的资源标识信息及信息资源在属性信息库中对应的引用的语义逻辑关系信息,所述目录库中用于保存用户创建的目录对应的目录标识信息及目录在属性信息库中对应的引用的语义逻辑关系信息;
相应的创建资源库的过程具体可以包括:
(1)输入需要管理的资源名称及资源值,系统可以自动生成资源的流水号作为资源标识信息;
其中,资源名称描述了资源的名字,资源值给出了系统能够操作资源的引用地址;
(2)根据步骤21中给出的每个属性,对任意一个资源进行设置;其中,在设置资源的属性值的过程中,一个资源在一个属性上只需设置一个属性值,比如,一个资源是中文简体的,则只选择简体属性值,相应的中文简体同时也是中文这一信息是由系统自动推理确定的;
(3)在资源库放置属性值对应的属性值编码,其中,该步骤(3)也可以推迟到检索阶段实现;
相应的创建目录库的过程具体可以包括:
(1)创建常用的目录,输入目录的名称,系统可以自动生成目录的流水号作为目录的标识信息;
(2)根据步骤21中给出的每个属性,对创建的目录进行设置,其中,在设置目录的属性值的过程中,与资源的配置方式类似,即:一个属性只选择一个属性值;
(3)在目录库放置属性值对应的属性值编码,其中,该步骤(3)也可以推迟到检索阶段实现;
步骤23,根据信息资源在属性信息库中对应引用的语义逻辑关系信息即资源编码及目录在属性信息库中对应引用的语义逻辑关系信息即目录编码,对资源库和目录库中的内容进行语义检索。
进一步地,在信息资源的管理过程中,还可以建立非私密的资源库和非私密的目录库,所述非私密的资源库可以包含或不包含信息资源的语义描述信息,所述非私密的目录库可以包含或不包含目录的语义描述信息;这样,当委托第三方服务器完成检索服务时,可将所述非私密资源库和非私密目录库传送给所述第三方服务器服务器,由第三方服务器完成语义检索。由于第三方服务器实现检索服务的过程中,仅需要非私密的资源库和非私密的目录库,这充分保护了用户在信息资源上的隐私权。
本发明实施例中,所述属性信息库、资源库(或非私密资源库)和目录库(或非私密目录库)可以为一个或多个用户所创建,并保存在相同或不同的联网实体设备中。具体地,若多个用户创建的资源库(或非私密资源库)或目录库(或非私密目录库)或属性信息库放在同一个实体设备中,则需要增加一个描述资源库(或非私密资源库)或目录库(或非私密目录库)或属性信息库和用户之间的关联关系的用户信息库,通过所述用户信息库能够识别所述资源库或目录库或属性信息库所属的用户,从而便于用户区分使用各自建立的资源库或目录库或属性信息库。
进一步地,本发明实施例中所述属性信息库中可以至少包括一个公共属性或一个私人属性,也就是说,在属性信息库中可以包括至少一个公共属性,以及零个或一个或多个私人属性,或者,在属性信息库中也可以包括至少一个私人属性,以及零个或一个或多个公共属性;
属性信息库中的公共属性及私人属性分别用属性值描述属性的语义描述信息,用属性值编码描述属性的语义逻辑关系信息,其中:
属性信息库中的公共属性是指由系统设定的不可被用户自由修改的属性;即公共属性可以为由系统定义的公共知识概念(其基于被大多数人认同的科学知识或实践中约定俗成的习惯或者是系统中确定的资源管理的方式等),包括人类普遍接受的一些科学分类方法,比如学科的分类,自然语言的种类,或生物学分类方法,或者网络中被大多数人使用的浏览器类别等等。若用户只建立包含一种类型信息资源的资源库(如资源库中仅包含网址或电话号码等单一信息),则属性信息库中可以不需要包含资源使用类型的公共属性;若资源库中具有多种不同类型的信息资源,则属性信息库中具有,且至少包含一个用于描述信息资源的运行或使用方式的公共属性信息,即标识资源的浏览或使用类型或者资源可以被何种共知的程序或方法打开,比如,信息资源是一个DOC文件,则其资源管理的公共属性便可以指出用WORD打开该信息资源,信息资源是一个HTML文件,则资源管理的公共属性可以指出用IE或者其他的某个浏览器来打开该信息资源;基于属性信息库中的该资源管理的公共属性及资源值,客户端可以实现跨语言的信息资源浏览及检索操作,即借助该资源管理的公共属性及资源值,系统就可以屏蔽信息资源自身的语言特性了,例如,无论一个网页是英文还是中文,都可以通过作为资源管理的公共属性及网页的网址统一访问;
属性信息库中的私人属性是指由创建者自己的解释应用的属性,即其语义对公众来说是未知的;且私人属性值完全由用户自己定义,依赖于用户的个人喜好而确定(用户随意创建个人属性的前提是其定义的属性值不能包含矛盾信息,比如,不能有A>B,B>C,同时又有C>A的情况出现);
属性信息库中的语义逻辑关系是指概念在语义上的包含、不包含、部分包含或者部分不包含关系,或者长度上的大于,小于等关系或高度上的高于,低于等关系或者是由用户假设的任何具有可推理性的私人语言概念;
在相应的属性信息库中的属性的属性值编码可以是一种二进制编码,所述二进制编码把属性值上的语义关系转换为数学上的值的偏序关系;
进一步地,一个目录对所有属性的属性值编码的引用信息可以构成目录的目录码,具体地,在目录库中各个目录在属性信息库中引用的属性值标识及属性值编码可以确定相应目录的目录码,即每个目录具有的一个或多个属性在属性信息库中对应的属性值标识及属性值编码共同组成该目录的目录码,例如,对于中文经济学目录,则其目录码由语言属性中的中文属性值和科目属性中的经济学属性值在属性信息库中对应的属性值标识及属性值编码共同组成;
进一步地,一个资源对所有属性的属性值编码的引用信息构成了资源对应的资源码,具体地,在资源库中各个资源在属性信息库中引用的属性值标识及属性值编码可以确定相应资源的资源码,即每个信息资源具有的一个或多个属性在属性信息库中对应的属性值标识及属性值编码共同组成该信息资源的资源码,例如,对于中文经济学图书方面的信息资源,则其资源码由其语言属性中的中文属性值、科目属性中的经济学属性值及文件类型属性中的图书属性值在属性信息库中对应的属性值标识及属性值编码共同组成;
利用上述目录码及资源码可以计算目录与目录之间,目录与资源之间的语义逻辑关系;例如,在目录的浏览或资源检索操作过程中,是针对资源库中的资源码及目录库中的目录码的进行关系比较查询实现的,例如,目录浏览可以为针对资源库中的资源码及目录库中的目录码的进行关系比较查询操作实现,资源检索则可以看作是针对检索操作建立临时目录,再按照相应的目录浏览操作即可以实现相应的资源检索操作。
进一步地,当用户利用自己的目录库去检索其他用户创建的资源库时,所应用的资源码及目录码中的有效部分只来自所述公共属性,且所述的检索过程可以由用户直接完成或者也可以委托第三方服务器完成。
为方便用户对于目录库中目录的创建,所述属性信息库中还可以包括:
属性的默认属性值标记和属性值的目录自动组合标记,以及由属性的默认属性值及具有目录自动组合标记的属性值组成的自动组合目录的属性值集合,其中,根据每个属性对应的自动组合目录的属性值集合,采用集合元素组合的方式自动生成目录。例如,用户可以将属性信息库中的中文属性值和期刊属性值设置相应的目录自动组合标记,这样便可以根据包含中文属性值和期刊属性值的自动组合目录的属性值集合生成相应的中文期刊目录。也就是说,由于可以创建的目录数目是非常大,且许多目录也并非用户需要的,因此,系统中的目录通常需要由用户手工管理,为了减轻用户的手工操作的工作量,便可以为每个属性值设置相应的目录自动组合标记,当该目录自动组合标记被设置有效时,便可以为用户自动生成相应的组合目录,该组合目录的名称可以初始化为多个属性值名称的组合,用户还可以在自动生成的目录的基础上自行修改创建的目录。
本发明实施例中,创建的属性信息库中包含了用户创建目录库及资源库的所有语言和语义信息,即包含了目录库中的目录和资源库中的资源的所有分类属性,该属性信息库中可以但不限于包括:
属性标识符、属性名称、属性类型、属性码类型、属性值标识符、属性值名称和属性值编码,以及属性值的目录自动组合标记,其中:
相应的属性标识符和属性值标识符用于作为确定属性信息库中记录的一条库记录的唯一性标识;
相应的属性名称用于描述属性的信息;
属性类型用于标识属性信息库中的属性为私人属性或者公共属性;
属性码类型用于标识属性编码的类型,即用于记述如何编码的标记;
属性值名称用于记录属性值的描述信息;
属性值编码,即属性值的语义编码,用于描述属性值之间的语义逻辑关系;
属性值的目录自动组合标记,用于标识系统是否使用该属性自动创建目录。
具体地,属性信息库的应用实例可以如表1所示:
表1
以上表1仅为便于理解而提供的一个属性信息库的描述性示例,在实施本发明的过程中,也可以采用其他形式的属性信息库,且其包含的内容和属性值编码均可以根据实际应用需求灵活变化,表1中属性值编码的一个例子可以参考表7,表8,表9,表10。
本发明实施例中,创建的资源库中可以包含所有的资源信息,进一步地,资源库的主要描述信息可以包括资源标识、资源名称、资源值、属性标识和属性值编码,其中:
相应的资源标识和属性标识共同可以作为一条资料库记录的唯一性标识;
相应的资源名称则为信息资源的描述性信息;
资源值是资源的访问标识值,系统通过公共属性给出的访问方法(若资源库中具有两种或两种以上操作方式的信息资源)或者默认访问方法(若资源库只有一种操作方式的信息资源)可以使用该信息资源,例如,通过IE可以访问的URI,通过打电话程序可以使用相应的电话号码,等等。
属性值编码则是来自属性信息库,用于表示信息资源的属性的语义逻辑关系信息,以便于确定信息资源与目录之间的关系,且就某信息资源而言,基于其所有属性的属性值编码便可以构成相应的资源码。
具体地,资源库的应用实例可以如表2所示:
表2
在表示中,作为信息资源的“报警电话”在科目属性类型上取值为“########”,其含义在本例中是不属于其他任何子类,实际应用中,也可以根据需要设置一个具体的空值属性值的属性值编码来表示,这个可以根据用户需要而定,同理,其他信息资源对应的属性值编码情况类似,只要可以表达出相应的含义,不拘泥于具体采用什么样的编码值。
即以上表2仅为一个资源库的应用实例,在实施本发明的过程中,也可以采用其他形式的资源库,且其包含的内容和属性值编码的形式均可以根据实际应用需求灵活变化。
本发明实施例中,创建的目录库中包含所有的目录信息,进一步地,目录库主要描述信息可以包括目录标识、目录名称、属性标识和属性值编码,其中:
相应的目录标识和属性值标识共同作为一条目录库记录的唯一性标识;
目录名称用于记录目录的描述性信息;
属性值编码,来自属性信息库,用于表示目录的属性的语义逻辑关系信息,以便于确定目录与目录之间,以及目录与信息资源之间的关系;且就某目录而言,基于其所有属性的属性值编码便可以构成相应的目录码。
具体地,目录库的应用实例可以如表3所示:
表3
资源标识 资源名称 属性标识 属性值编码
1 根目录 1 #######
1 根目录 2 ########
1 根目录 3 #######
1 根目录 4 #######
2 电话号码 1 00001##
2 …… …… ……
3 图书 1 1###000
3 …… …… ……
4 中文资料 1 #######
4 …… …… ……
5 经济学资料 1 #######
5 …… …… ……
6 期刊 1 #######
6 …… …… ……
7 中文简体资料 1 #######
7 …… …… ……
8 中文经济学资料 1 #######
8 …… …… ……
9 经济学期刊 1 #######
9 …… …… ……
10 中文经济学权威期刊 1 #######
10 …… …… ……
11 中文经济学图书 1 #######
11 …… …… ……
12 中文经济学简体图书 1 1###000
12 中文经济学简体图书 2 101#####
12 中文经济学简体图书 3 10001##
12 中文经济学简体图书 4 1110000
13 …… …… ……
…… …… …… ……
表3中所有目录的语义关系可以如图3所示。
以上表3仅为一个目录库的应用实例,在实施本发明的过程中,也可以采用其他形式的目录库,且其包含的内容和属性值编码的形式均可以根据实际应用需求灵活变化。
下面将举例对目录的属性值编码和资源的属性值编码的编码方式进行说明。
具体地,概念码使用一个由符号(0,1,#)组成的字符串表示任意一个概念,概念码之间的运算规则是一种三值运算逻辑,其中,三值∧运算真值如表4所示,三值∨运算真值如表5所示;
表4
表5
Ai 0 0 0 1 1 1 # # #
Bi 0 1 # 0 1 # 0 1 #
Ai∨Bi 0 # # # 1 # # # #
在上述表4和表5中,∧运算可以认为是求子概念,∨运算可认为是求父概念;表示逻辑矛盾;
令概念x的概念码是L(x),利用概念码,概念之间的从属关系可以按照如下判断:
若概念x1,x2满足L(x1)∧L(x2)=L(x1),则有x1是x2的子概念;
进一步地,针对以上三进制逻辑运算,本发明实施例还提供了一种基于二进制的编码则,相应的三进制逻辑符号的二进制表示法如表6所示:
表6
在表6中,以2个比特表示三进制逻辑符号,利用上述表6给出的符号表示法则,便可以将三进制逻辑中的求父概念运算转换位二进制的按位或运算,以及三进制逻辑中的求子概念运算转换位二进制的按位与运算(在表6中,可以用01表示三进制符号1,10表示三进制符号0,也是可以的)。
假设有科目属性,其属性值如图4所示,则其属性值编码结果可以如表7所示:
表7
科目属性的属性值 属性值编码
任意科目A ########
社会科学B 1#######
自然科学C #1######
经济学D 101#####
哲学E 1##1####
数学F #1##1###
物理学G 01###1##
经济哲学H 1#11##1#
数学哲学I 11#11##1
表7中的属性值编码存储于属性信息库中,并可以被目录库与资源库引用,基于表7所示的编码结果,则可以判断属性值之间的语义包含关系:
假设需要判断数学哲学I(11#11##1)是否属于社会科学B(#1######),则可以直接使用属性值编码进行语义包含关系的计算,即:
L(I)∧L(B)=11#11##1∧#1######=11#11##1=L(I),其中,∧为求子概念的运算符号,基于表6可以将L(I)∧L(B)转换为二进制的按位与运算便可以获得计算结果,相应的二进制运算如下:
L(I)∧L(B)=10 10 11 10 10 11 11 10∧ 11 10 11 11 11 11 11 11=10 10 11 10 10 11 1110=L(I);
因此,根据上述计算结果确定数学哲学I是社会科学B的子概念,即数学哲学I属于社会科学B。
再假设有一个文件类型属性,其属性值包括:期刊(权威类期刊,一般期刊),以及图书(专著,汇编),相应的语义关系如图5所示,其属性值编码如表8所示:
表8
文件类型属性的属性值 属性值编码
根值 #######
空值 0000000
任意值 1######
期刊A 11##000
权威类期刊B 1110000
一般期刊C 1101000
图书D 10001##
专著E 1000110
汇编F 1000101
再假设有一个语言属性,其属性值包括:中文(简体,繁体),外文(英文,日文),相应的语义关系如图6所示,其属性值编码如表9所示:
表9
文件类型属性的属性值 属性值编码
根值 #######
空值 0000000
任意值 1######
中文A 11##000
简体B 1110000
繁体C 1101000
外文D 10001##
英文E 1000110
日文F 1000101
从上述表8和表9可以看出,表8和表9中的属性值不同,但是,其属性值编码是相同的,正是这种特性实现了语义与语义逻辑关系的分离,进而保护了用户的隐私信息。
基于以上表7至表9记录的三种不同类型的属性,可以建立多个目录,例如:
若建立“中文”目录,其对应的目录的属性值编码是(假设按照表7,8,9的顺序排列属性值码):######## ####### 11##000;
若建立“中文经济学期刊”目录,其对应的目录的属性值编码是:
101##### 11##000 11##000;
若建立“中文简体经济学权威期刊”目录,其对应的目录的属性值编码是:
101##### 1110000 1110000;
基于相应的属性值编码可以计算得出:“中文”目录是“中文经济学期刊”目录的父目录,也是“中文简体权威经济学期刊”目录的父目录。以“中文经济学期刊”与“中文简体经济学权威期刊”的关系比较为例,计算过程如下:
L(中文经济学期刊)∧L(中文简体权威经济学期刊)=101##### 11##000 11##000∧101#####1110000 1110000=101##### 1110000 1110000=L(中文简体权威经济学期刊),相应的二进制运算结果也是一样的,如下:
L(中文经济学期刊)∧L(中文简体权威经济学期刊)
=10 01 10 11 11 11 11 11  10 10 11 11 01 01 01  10 10 11 11 01 01 01
∧10 01 10 11 11 11 11 11  10 10 10 01 01 01 01  10 10 10 01 01 01 01
=10 01 10 11 11 11 11 11  10 10 10 01 01 01 01  10 10 10 01 01 01 01
=L(中文简体权威经济学期刊),
所以,目录“中文简体权威经济学期刊”是目录“中文经济学期刊”的子目录。
进一步地,若考虑系统属性,如图7所示,可以得到表10所示的属性值码:
表10
文件类型属性的属性值 属性值编码
任意方式: #######
浏览工具 1###000
WORD 1100000
ADOBE 1010000
Internet Explorer 1001000
通讯工具 00001##
电话 0000110
短信 0000101
根据同样的方式,可以确定资源的属性值编码。
以上属性值编码的确定方式只是相应的应用举例,并不构成对本发明的唯一限定。
本发明实施例中,在对属性信息编码的过程中,如果属性值之间的语义关系满足一种特殊的关系,比如树形关系,如前文所述的语言属性(属性值语义关系如图6所示),其相应的属性值编码(包括对目录管理信息及资源管理信息的编码),可以使用如下方式实现:
(1)设置根值节点的属性值编码为:0;设置空值节点的属性值编码为:00;
设置任意值节点的属性值编码为:01。
(2)在任意节点01下面扩展其他属性节点,每扩展一层子节点,则字符长度增加一个,且子节点前面的字符和父节点相同,每增加一个子节点,末尾字符值加1
表11
在上述表11中,相应的求父概念及子概念的过程,可以将位运算操作变更为字符串间的模式匹配操作。虽然字符串的模式匹配运算效率低于按位运算的效率且存储空间大于二进制的概念码,但是在属性配置的时候,人工比较容易理解,故可以作为本发明实施例的一种具体应用的实现方式。
本发明实施例中,还可以进行相应的目录浏览操作,相应的目录浏览操作及显示返回结果的图形用户界面的过程可以包括:
当确定当前选中目录后,在目录库中确定当前选中目录的父目录或直接父目录、兄弟目录、子目录或直接子目录及其包含的信息资源,其中,所述父目录或直接父目录、子目录或直接子目录都可以为零个或一个或多个;
之后,便可以在各个预先设定的区域中分别显示相应的父目录(或直接父目录)、子目录(或直接子目录)、兄弟目录及当前目录和当前目录中包含的信息资源,具体可以参照图8所示,包括:
在显示界面中设置的父目录区显示当前选中目录的父目录或直接父目录;
在显示界面中设置的兄弟目录区显示当前选中目录和当前选中目录的兄弟目录;
在显示界面中设置的子目录区显示当前选中目录的子目录或直接子目录;
以及在显示界面中设置的资源区显示当前选中目录下的信息资源。
以图3为例,当确定一个当前选中目录时,不仅需要确定有多个子目录,还要确定多个父目录及多个兄弟目录。本发明实施例中,相应的父目录区、兄弟目录区、子目录区和资源区均可以支持多项显示功能,例如,详细显示目录或资源的备注信息,列表显示,概要显示等。
本发明实施例的实现使得在有限的界面空间中可以展示复杂的目录包含关系,对于任一个选择目录,都可以显示其子目录,父目录及兄弟目录,且目录和资源之间的关系是一种语义上的包含关系,使得信息资源显示更加符合人类的自然语言习惯。
另外,需要说明的是,本发明实施例在具体应用过程中,相应的父目录区、子目录区、兄弟目录区和资源区这四个区域的组合显示方式有多种,而并不仅限于图8所示的显示方式,例如,还可以但不限于包括图9至图12所示的几种显示方式。
其中,图11所示的显示方式中,具体是在屏幕显示控件允许的情况下,可以增加一个缩略图显示区域(或者也可以称之为第五区域),通过点击缩略图区域,对当前选中目录进行更改,进而刷新整个显示界面。
对于图12所示的显示方式,其中相应的父目录(或子目录)的显示有多种方式,例如,显示所有的父目录(或子目录)或者显示直接父目录(或直接子目录),或者,也可以动态切换显示,等等。类似的,在显示直接父目录时,也可以增加一个所有父目录的显示项或者根目录的显示项等等。
当然,在一些没有目录交互界面的服务器程序中,同样可以采用本发明提供的实现方案进行相应的信息资源和目录的管理操作,如网络中常见的垂直搜素引擎的构建中,可以利用本发明的编码机制对元数据进行编码优化,一方面,本发明提供的编码机制可以提高检索速度,另一方面,也可以对用户检索的结果进行相关的子目录分类显示,提高界面交互的友好性。
具体地,当给出任意一个访问目录A时,则可以向服务器提出如下检索操作:
(1)在目录库中找出指定目录A的直接父目录;
根据目录码便可以直接查找目录A的父目录,假设对于目录X,针对任意一个属性P,如果目录X在属性P上的属性值都是目录A在属性P上的属性值的父属性值或属性值相等,则目录X是目录A的父目录;
一个目录Y,如果目录Y是目录A的父目录,但Y不是目录A的父目录的父目录,则目录Y是目录A的直接父目录。
以图3为例,假设当前选择的目录是“中文经济学”,则其直接父目录是“中文”和“经济学”。
(2)在目录库中找出指定目录A的直接子目录;
根据目录A的属性编码值,可以直接查找目录A的子目录,假设对于目录X,针对任意一个属性P,如果目录X在属性P上的属性值都是目录A在属性P上的属性值的子属性值或属性值相等,则目录X是目录A的子目录;
一个目录Y,如果目录Y是目录A的子目录,但目录Y不是目录A的子目录的子目录,则目录Y是目录A的直接子目录。
仍以图3为例,假设当前选择的目录是“中文经济学”,则其直接子目录是“中文经济学权威期刊”和“中文经济学图书”。
(3)在目录库中找出指定目录A的兄弟目录;
对于目录A,其父目录的直接子目录便是目录A的兄弟目录。
以图3为例,假设当前选择的目录是“中文经济学”,则其兄弟目录是“经济学期刊”和“中文简体”。
(4)在资源库中找出指定目录A包含的信息资源;
根据目录码,可以在资源库中直接查找属于目录A的信息资源。
以图3为例,假设当前选择的目录是“中文经济学”,则其包含的资源可以是上述表2中的“自由经济与老子学说”,资源值是“C:\自由经济与老子学说.doc”,且该资源可以用WORD打开。
本发明实施例中,还可以在利用第三方服务器搜索用户的私人信息时,有效保护用户的隐私权,相应的处理过程可以包括:
在检索过程中,客户端可以仅仅向第三方服务器提交资源库和目录库中的唯一性标识符及属性值码信息,这样,第三方服务器便无法获知具体的信息资源及目录的语义内容,且同样可以完成相应的语义搜索处理。或者,也可以根据资源库和目录库生成非私密性资源库和目录库(其中仅维护有用户允许提供给第三方服务器的非私密性的信息),并向服务器端仅提供非私密性资源库和目录库,以保证服务器端可以同样实现前述的搜索功能,同时还可以保护用户信息的私密性。
本发明实施例中,还可以在搜索其他用户共享的资源库时,能够提供与语言无关的语义检索操作,例如,对于多个客户端,且客户端分别建立有自己的资源库的情况,若有的客户端希望与其他客户端共享信息资源,则在其他客户端在不知道该信息资源的表现语言的情况下仍能够检索到该信息资源并访问。为实现与语言无关的语义检索操作,需要在属性信息库中包含相应的公共属性,且共享信息资源的客户端需要使用相应的公共属性构建资源库。由于资源库中的属性值编码与语言无关,同时公共属性也给出了资源的浏览或使用方式,因此,利用属性值编码,便可以实现与语言无关的语义检索。例如,若用户希望搜索关于苹果的网页,则通过本发明实施例中苹果对应的属性值编码便可以搜索到所有含有该属性值的网页(无论该网页是以哪种自然语言呈现,也无论该网页属性描述中给出的是红富士还是黄元帅或者是澳洲青苹的属性值编码),从而实现了与语言无关的语义检索操作。
用户在搜索其他用户共享的资源库时,可以由用户自身的客户端实现,也可以通过独立的第三方服务器实现。
本发明实施例还提供了一种单一客户端系统智能化管理系统,其具体实现结构如图13所示,可以包括:
客户端界面交互处理模块,用于接收用户的检索、操作请求,根据返回结果组织生成相应的用户界面;
客户端管理模块,用于根据用户操作命令完成对属性信息库,资源库,目录库的管理及对所述资源库和目录库中的内容进行语义检索;
本地信息存储模块,用于保存属性信息库,资源库,目录库的信息。
该实施例中提供了一种高效、方便的智能化信息管理系统,可以应用于手机,PC等智能化终端,可以在有限的界面空间内展示复杂的概念语义关系。
本发明实施例还提供了一种保护用户私密的搜索服务的智能化管理系统,其具体实现结构如图14所示,可以包括:
客户端界面交互处理模块,用于接收用户的检索、操作请求,根据返回结果组织生成相应的用户界面;
客户端管理模块,用于根据用户操作命令完成对本地信息存储模块中属性信息库,资源库,目录库的管理及非私密的目录库及非私密的资源库的生成及委托公共信息管理模块进行管理(如生成、更新、检索或浏览等);
本地信息存储模块,用于保存属性信息库,资源库,目录库的信息;
公共信息管理服务模块,用于和客户端管理模块通信并接受客户端管理模块的委托管理(如生成、更新、检索或浏览等)公共信息存储模块中的信息;
公共信息存储模块,用于存储非私密的目录库及非私密的资源库及用户信息库;
该实施例中不仅可以在有限的界面空间内展示复杂的概念语义关系,而且可以充分保护用户的私密信息,可以应用于云搜索服务等系统。
本发明实施例还提供了具有网络搜索服务的智能化管理系统,其具体实现结构如图15所示,可以包括:
多个分布于网络中的客户端界面交互处理模块,用于接收用户的检索或浏览等管理操作请求,根据返回结果组织生成相应的用户界面;
多个客户端管理模块,用于根据用户操作命令完成对本地信息存储模块中属性信息库,资源库,目录库的管理及检索本地信息存储模块中的信息或者委托服务器端管理模块进行检索;
多个本地信息存储模块,用于保存属性信息库,资源库,目录库的信息;其中,若多个用户创建的本地信息存储模块存放在同一个实体设备中,则需要增加一个描述资源库或目录库或属性信息库和用户之间的关联关系的用户信息库,通过所述用户信息库能够识别所述资源库或目录库或属性信息库所属的用户;
多个服务器端管理模块,用于和客户端管理模块或其他服务器端管理模块通信并接受客户端管理模块或其他服务器端管理模块的委托实现管理(如检索或浏览等)操作;某一服务器端管理模块可以以属性信息库中的公共属性为基础对本地信息存储模块进行检索或委托其他服务器端管理模块完成检索或者同时综合处理两种检索结果。
在该图15所示的系统中还可以包括上述公共信息管理服务模块和公共信息存储模块,此时,相应的客户端管理模块可以根据用户命令管理(如生成、更新、检索或浏览等)本地信息存储模块或者委托网络信息检索模块检索公共信息存储模块或者同时综合处理两种检索结果。
该实施例中不仅可以在有限的界面空间内展示复杂的概念语义关系,而且可以实现与语言无关的语义检索,可以应用于网络分类搜索服务或者是垂直搜素引擎中关于元数据的编码处理等系统。
在本发明提供的实施例中,所述客户端界面交互处理模块可以接受用户的管理命令及目录浏览操作并显示返回结果,所述管理包括目录,资源,及私人属性的增加,修改及删除操作,所述的目录浏览包括,
当确定当前选中目录后,在目录库中确定当前选中目录的父目录或直接父目录、兄弟目录、子目录或直接子目录及其包含的信息资源,其中,所述父目录或直接父目录、子目录或直接子目录都可以为零个或一个或多个;
在显示界面中设置的父目录区显示当前选中目录的父目录或直接父目录;
在显示界面中设置的兄弟目录区显示当前选中目录和当前选中目录的兄弟目录;
在显示界面中设置的子目录区显示当前选中目录的子目录或直接子目录;
以及在显示界面中设置的资源区显示当前选中目录下的信息资源。
在本发明提供的实施例中,所述客户端管理模块用于根据用户命令管理(如生成、更新、检索或浏览等)本地信息存储模块或者委托公共信息管理服务模块检索公共信息存储模块或者委托服务器端管理模块检索其他用户的本地信息存储模块或者同时综合处理若干种检索结果;
在本发明提供的实施例中,所述本地信息存储模块,用于存储用户的属性信息库,资源库,目录库;所述的属性信息库,用于保存属性信息,所述属性信息包括属性的语义描述信息及分类和检索过程中使用的语义逻辑关系信息;所述的资源库,根据所述属性信息库中的属性信息创建,用于保存需要管理的信息资源对应的资源标识信息及信息资源在属性信息库中对应的引用的语义逻辑关系信息;所述的目录库,根据所述属性信息库中的属性信息创建,用于保存用户创建的目录对应的目录标识信息及目录在属性信息库中对应的引用的语义逻辑关系信息;若多个用户创建的本地信息存储模块存放在同一个实体设备中,则需要增加一个描述资源库或目录库或属性信息库和用户之间的关联关系的用户信息库,通过所述用户信息库能够识别所述资源库或目录库或属性信息库所属的用户。
在本发明提供的实施例中,所述公共信息管理模块,可以和客户端管理模块通信并接受客户端管理模块的委托完成管理(如生成、更新、检索或浏览等)公共信息存储模块的信息资源;
在本发明提供的实施例中,所述公共信息存储模块,用于存储非私密的目录库及非私密的资源库及用户信息库,所述非私密的资源库包含或不包含信息资源的语义描述信息,所述非私密的目录库包含或不包含目录的语义描述信息;所述用户信息库能够识别所述非私密资源库或非私密目录库所隶属的用户。
在本发明提供的实施例中,所述服务器端管理模块以公共属性为基础对本地信息存储模块进行检索或委托其他服务器端管理模块完成检索或者委托公共信息管理服务模块进行检索或者同时综合处理几种检索结果;
在上述系统中,各个处理单元或实体的处理功能在之前的方法实施例中已经描述,故再此就不再一一赘述。
通过本发明实施例提供的系统中,可以在有限的界面空间中可以展示复杂的目录包含关系,对于任一个选择目录,都可以显示其子目录,父目录及兄弟目录,且目录和资源之间的关系是一种语义上的包含关系,使得信息资源显示更加符合人类的自然语言习惯。同时,还提供一种方便的资源分类方法及资源语义搜索算法,提高了搜索处理的效率。另外,本发明实施例中,在利用第三方服务器(网络服务器)提供的本地资源搜索服务时,还可以充分保护用户的隐私权。同时,当应用于网络搜索服务时,本发明提供了一个跨语言的语义搜索系统。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (13)

1.一种信息资源的智能化管理方法,其特征在于,包括:
创建或利用属性信息库中的属性信息,所述属性信息包括属性的语义描述信息和属性的语义逻辑关系信息,所述的语义逻辑关系信息可在分类和检索过程中使用,所述的语义逻辑关系是指概念在语义上的包含、不包含、部分包含或者部分不包含关系,所述语义逻辑关系使用属性值编码来表示,所述属性值编码是一种二进制编码或字符串编码,所述二进制编码或字符串编码把属性的语义逻辑关系转换为数学上的值或字符串模式匹配上的偏序关系;
根据属性信息库中的属性信息创建资源库和目录库,所述资源库中用于保存需要管理的信息资源对应的资源标识信息及信息资源在属性信息库中对应的引用的语义逻辑关系信息,所述资源库中各个资源在属性信息库中引用的属性值标识及属性值编码确定了资源的资源码;所述目录库中用于保存用户创建的目录对应的目录标识信息及目录在属性信息库中对应的引用的语义逻辑关系信息,所述目录库中各个目录在属性信息库中引用的属性值标识及属性值编码确定了目录的目录码,所述目录码及资源码可以用于计算目录与目录之间,目录与资源之间的语义逻辑关系;
根据信息资源在属性信息库中对应引用的语义逻辑关系信息及目录在属性信息库中对应引用的语义逻辑关系信息,对资源库和目录库中的内容进行语义检索,且在目录的浏览或资源检索过程中,是针对资源库中的资源码及目录库中的目录码进行关系比较查询实现的。
2.根据权利要求1所述的方法,其特征在于,该方法还包括:
建立非私密的资源库和非私密的目录库,所述非私密的资源库包含或不包含信息资源的语义描述信息,所述非私密的目录库包含或不包含目录的语义描述信息;
若多个用户创建的非私密资源库及非私密目录库放在同一个实体设备中,则需要增加一个描述资源库或目录库或属性信息库和用户之间的关联关系的用户信息库,通过所述用户信息库能够识别所述非私密资源库或非私密目录库所隶属的用户;
当委托第三方服务器完成检索服务时,第三方服务器可以通过所述非私密资源库和非私密目录库完成语义检索。
3.根据权利要求1所述的方法,其特征在于,所述属性信息库、资源库和目录库为一个或多个用户所创建,并保存在相同或不同的联网实体设备中,若多个用户创建的资源库或目录库或属性信息库放在同一个实体设备中,则需要增加一个描述资源库或目录库或属性信息库和用户之间的关联关系的用户信息库,通过所述用户信息库能够识别所述资源库或目录库或属性信息库所属的用户。
4.根据权利要求1、2或3所述的方法,其特征在于,所述属性信息库包括:
至少一个公共属性,以及零个或一个或多个私人属性;或者,至少一个私人属性,以及零个或一个或多个公共属性;
所述的公共属性及私人属性分别采用属性值描述属性的语义描述信息,属性值编码描述属性的语义逻辑关系信息;
所述的公共属性是指由系统设定的不可被用户自由修改的属性;
所述的私人属性是指由创建者自己解释应用的属性;
所述公共属性包括资源管理的公共属性,若资源库中具有两种或两种以上操作方式的信息资源,则属性信息库中至少包含一个用于描述信息资源的运行或使用方式的属性信息。
5.根据权利要求4所述的方法,其特征在于,该方法还包括:
当用户利用自己的目录库去检索其他用户创建的资源库时,所应用的资源码及目录码中的有效部分只来自所述公共属性,且所述的检索过程由用户直接完成或委托第三方服务器完成。
6.根据权利要求1、2或3所述的方法,其特征在于,所述属性信息库中还包括:
属性的默认属性值标记和属性值的目录自动组合标记,以及由属性的默认属性值及具有目录自动组合标记的属性值组成的自动组合目录的属性值集合,其中,根据每个属性对应的自动组合目录的属性值集合,采用集合元素组合的方式生成目录。
7.根据权利要求1、2或3所述的方法,其特征在于,
该方法还包括目录浏览操作及显示返回结果的图形用户界面,包括:
当确定当前选中目录后,在目录库中确定当前选中目录的父目录或直接父目录、兄弟目录、子目录或直接子目录及其包含的信息资源,其中,所述父目录或直接父目录、子目录或直接子目录都可以为零个或一个或多个;
在显示界面中设置的父目录区显示当前选中目录的父目录或直接父目录;
在显示界面中设置的兄弟目录区显示当前选中目录和当前选中目录的兄弟目录;
在显示界面中设置的子目录区显示当前选中目录的子目录或直接子目录;
以及在显示界面中设置的资源区显示当前选中目录下的信息资源。
8.一种信息资源的智能化管理系统,其特征在于,包括:
客户端界面交互处理模块,用于收集用户管理及检索操作命令,并返回操作结果;
客户端管理模块,根据用户命令管理本地信息存储模块,且在目录的浏览或资源检索过程中,是针对资源库中的资源码及目录库中的目录码进行关系比较查询实现的;
本地信息存储模块,用于存储用户的属性信息库、资源库和目录库,其中,所述的属性信息库,用于保存属性信息,所述属性信息包括属性的语义描述信息和属性的语义逻辑关系信息,所述语义逻辑关系信息可在及分类和检索过程中使用,所述语义逻辑关系是指概念在语义上的包含、不包含、部分包含或者部分不包含关系,所述语义逻辑关系使用属性值编码来表示,所述属性值编码是一种二进制编码或字符串编码,所述二进制编码或字符串编码把属性的语义逻辑关系转换为数学上的值或字符串模式匹配上的偏序关系;所述的资源库,根据所述属性信息库中的属性信息创建,用于保存需要管理的信息资源对应的资源标识信息及信息资源在属性信息库中对应的引用的语义逻辑关系信息,所述资源库中各个资源在属性信息库中引用的属性值标识及属性值编码确定了资源的资源码;所述的目录库,根据所述属性信息库中的属性信息创建,用于保存用户创建的目录对应的目录标识信息及目录在属性信息库中对应的引用的语义逻辑关系信息,所述目录库中各个目录在属性信息库中引用的属性值标识及属性值编码确定了目录的目录码,所述目录码及资源码可以用于计算目录与目录之间,目录与资源之间的语义逻辑关系。
9.根据权利要求8所述的系统,其特征在于,还包括:
公共信息存储模块,公共信息管理模块,及非私密的资源库和非私密的目录库;
所述非私密的资源库包含或不包含信息资源的语义描述信息,所述非私密的目录库包含或不包含目录的语义描述信息;
所述非私密资源库和非私密目录库存储于或者临时存储于公共信息存储模块,并由公共信息管理模块管理及检索分析;
若有多个用户创建的非私密资源库及非私密目录库放在同一个公共信息存储模块中,则需要增加一个描述资源库或目录库或属性信息库和用户之间的关联关系的用户信息库,通过所述用户信息库能够识别所述非私密资源库或非私密目录库所隶属的用户;
所述公共信息管理模块可以和客户端管理模块通信并接受客户端管理模块的委托完成管理公共信息存储模块的信息资源;
所述客户端管理模块可以根据用户命令管理本地信息存储模块,和/或,委托公共信息管理模块检索公共信息存储模块。
10.根据权利要求8所述的系统,其特征在于,还包括:
多个分布于网络的客户端界面交互处理模块,多个客户端管理模块,以及多个本地信息存储模块;
若多个用户创建的本地信息存储模块存放在同一个实体设备中,则需要增加一个描述资源库或目录库或属性信息库和用户之间的关联关系的用户信息库,通过所述用户信息库能够识别所述资源库或目录库或属性信息库所属的用户。
11.根据权利要求8、9或10所述的系统,其特征在于,所述属性信息库包括:
至少一个公共属性,以及零个或一个或多个私人属性;或者,至少一个私人属性,以及零个或一个或多个公共属性;
所述的公共属性及私人属性分别采用属性值描述属性的语义描述信息,属性值编码描述属性的语义逻辑关系信息;
所述的公共属性是指由系统设定的不可被用户自由修改的属性;
所述的私人属性是指由创建者自己的解释应用的属性;
所述公共属性包括资源管理的公共属性,若资源库中具有两种或两种以上操作方式的信息资源,则属性信息库中至少包含一个用于描述信息资源的运行或使用方式的属性信息。
12.根据权利要求11所述的系统,其特征在于,该系统还包括:
多个服务器端管理模块,用于与客户端管理模块通信并接受客户端管理模块的委托完成管理操作;
所述服务器端管理模块以公共属性为基础对本地信息存储模块进行检索或委托其他服务器端管理模块完成检索或者同时综合处理两种检索结果;
所述客户端管理模块可以根据用户命令管理本地信息存储模块或者委托网络信息检索模块检索公共信息存储模块或者同时综合处理两种检索结果,所述根据用户命令管理本地信息存储模块包括检索本地信息存储模块。
13.根据权利要求8、9或10所述的系统,其特征在于:
所述客户端界面交互处理模块可以接受用户的管理命令及目录浏览操作并显示返回结果,所述管理包括目录,资源,及私人属性的增加,修改及删除操作,所述的目录浏览包括:
当确定当前选中目录后,在目录库中确定当前选中目录的父目录或直接父目录、兄弟目录、子目录或直接子目录及其包含的信息资源,其中,所述父目录或直接父目录、子目录或直接子目录都可以为零个或一个或多个;
在显示界面中设置的父目录区显示当前选中目录的父目录或直接父目录;
在显示界面中设置的兄弟目录区显示当前选中目录和当前选中目录的兄弟目录;
在显示界面中设置的子目录区显示当前选中目录的子目录或直接子目录;
以及在显示界面中设置的资源区显示当前选中目录下的信息资源。
CN201210390376.9A 2012-10-15 2012-10-15 信息资源管理及语义检索方法 Expired - Fee Related CN102880720B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210390376.9A CN102880720B (zh) 2012-10-15 2012-10-15 信息资源管理及语义检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210390376.9A CN102880720B (zh) 2012-10-15 2012-10-15 信息资源管理及语义检索方法

Publications (2)

Publication Number Publication Date
CN102880720A CN102880720A (zh) 2013-01-16
CN102880720B true CN102880720B (zh) 2015-09-23

Family

ID=47482046

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210390376.9A Expired - Fee Related CN102880720B (zh) 2012-10-15 2012-10-15 信息资源管理及语义检索方法

Country Status (1)

Country Link
CN (1) CN102880720B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112597374B (zh) * 2016-05-24 2024-03-22 创新先进技术有限公司 一种互联网信息资源的分配方法及装置
US20190207946A1 (en) * 2016-12-20 2019-07-04 Google Inc. Conditional provision of access by interactive assistant modules
CN108228690A (zh) * 2017-06-30 2018-06-29 勤智数码科技股份有限公司 一种目录管理系统及其管理方法
CN108052666A (zh) * 2017-12-29 2018-05-18 北京奇虎科技有限公司 一种内容推荐方法和装置
CN110297971B (zh) * 2019-05-30 2022-09-20 百度在线网络技术(北京)有限公司 个性化资源检索方法、装置、设备及计算机可读存储介质
CN110515896B (zh) * 2019-08-29 2021-10-26 网易(杭州)网络有限公司 模型资源管理方法、模型文件制作方法、装置和系统
CN112035709A (zh) * 2020-08-25 2020-12-04 上海中通吉网络技术有限公司 资源目录的编排方法、高速读取方法、装置和设备
CN113377895A (zh) * 2021-05-13 2021-09-10 王宇 基于目录树的网络知识点组织方法及装置
CN115544024B (zh) * 2022-11-09 2023-03-24 北京声迅电子股份有限公司 一种基于公共语义字段的数据处理方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101145218A (zh) * 2007-10-24 2008-03-19 中山大学 一种道路自动编码系统
CN101253501A (zh) * 2005-09-22 2008-08-27 株式会社东芝 用于创建层次字典的装置、方法和计算机程序产品
CN101923582A (zh) * 2010-09-21 2010-12-22 沈阳酷洲软件开发有限公司 国际化的动态电子信息模式方法
WO2011066719A1 (zh) * 2009-12-01 2011-06-09 Fu Zhijie 一种数据的分类、存储以及查询方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101253501A (zh) * 2005-09-22 2008-08-27 株式会社东芝 用于创建层次字典的装置、方法和计算机程序产品
CN101145218A (zh) * 2007-10-24 2008-03-19 中山大学 一种道路自动编码系统
WO2011066719A1 (zh) * 2009-12-01 2011-06-09 Fu Zhijie 一种数据的分类、存储以及查询方法
CN101923582A (zh) * 2010-09-21 2010-12-22 沈阳酷洲软件开发有限公司 国际化的动态电子信息模式方法

Also Published As

Publication number Publication date
CN102880720A (zh) 2013-01-16

Similar Documents

Publication Publication Date Title
CN102880720B (zh) 信息资源管理及语义检索方法
US20050203943A1 (en) Personalized classification for browsing documents
US8626792B2 (en) Hierarchical structured abstract data organization system
US20210303529A1 (en) Hierarchical structured data organization system
CN104391908B (zh) 一种图上基于局部敏感哈希的多关键字索引方法
Varfolomeyev et al. Smart personal assistant for historical tourism
Banane et al. Storing RDF data into big data NoSQL databases
Laclavík et al. Emails as graph: relation discovery in email archive
Vajk et al. Automatic NoSQL schema development: A case study
Das et al. A study on big data integration with data warehouse
US20150058363A1 (en) Cloud-based enterprise content management system
Canbay et al. Big data anonymization with spark
CN105007314A (zh) 面向海量读者阅读数据的大数据处理系统
Gupta et al. DPRel: a meta-path based relevance measure for mining heterogeneous networks
Ananthi et al. FSS-SDD: fuzzy-based semantic search for secure data discovery from outsourced cloud data
Shakhovska et al. Big Data Model" Entity and Features"
Priss Facet-like structures in computer science
CN110928963B (zh) 针对运维业务数据表的列级权限知识图谱构建方法
Sen et al. Dynamic discovery of query path on the lattice of cuboids using hierarchical data granularity and storage hierarchy
Dai et al. Search Engine System Based on Ontology of Technological Resources.
Blanke et al. Back to our data—experiments with nosql technologies in the humanities
CN104461494B (zh) 一种生成数据处理工具的数据包的方法及装置
Shentu et al. Mechanism design of data management system for nuclear power
Theodorakis et al. Querying contextualized information bases
Miller et al. Object-oriented data warehouse for information fusion from heterogeneous distributed data and knowledge sources

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150923

Termination date: 20211015