CN101937442A - 用于缓存术语数据的方法和系统 - Google Patents

用于缓存术语数据的方法和系统 Download PDF

Info

Publication number
CN101937442A
CN101937442A CN2009101509658A CN200910150965A CN101937442A CN 101937442 A CN101937442 A CN 101937442A CN 2009101509658 A CN2009101509658 A CN 2009101509658A CN 200910150965 A CN200910150965 A CN 200910150965A CN 101937442 A CN101937442 A CN 101937442A
Authority
CN
China
Prior art keywords
term
concepts
transitive relations
term concepts
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009101509658A
Other languages
English (en)
Inventor
刘海峰
胡岗
刘升平
侯雪桥
李波
李静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to CN2009101509658A priority Critical patent/CN101937442A/zh
Priority to US12/824,357 priority patent/US8301841B2/en
Publication of CN101937442A publication Critical patent/CN101937442A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24552Database cache management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/568Storing data temporarily at an intermediate stage, e.g. caching
    • H04L67/5682Policies or rules for updating, deleting or replacing the stored data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/568Storing data temporarily at an intermediate stage, e.g. caching
    • H04L67/5683Storage of data provided by user terminals, i.e. reverse caching

Abstract

本发明提供一种用于缓存术语数据的方法。该方法包括:接收术语请求;确定该术语请求与至少一个未被缓存的术语概念有关;获取该术语概念的完全概念集作为缓存单元,其中该完全概念集包括该术语概念、与该术语概念通过非传递性关系直接关联或间接关联的其他所有术语概念、各术语概念的属性、以及各术语概念之间的非传递性关系;针对该完全概念集,获取传递性关系信息,该传递性关系信息至少包括与该完全概念集中的每个术语概念通过传递性关系关联的术语概念的标识;以及对该缓存单元和该缓存单元的该传递性关系信息进行缓存。本发明还提供相应的用于缓存术语数据的装置。

Description

用于缓存术语数据的方法和系统
技术领域
本发明涉及数据管理技术,特别地,本发明涉及用于在术语服务中用于缓存语义数据的方法和系统。
背景技术
术语服务是指应用户的需求从特定专业领域的术语知识集合中返回特定内容的服务。基于语义的应用,例如语义查询,需要术语服务器提供语义支持,即由术语服务器向客户端提供概念的定义以及概念之间的关系的定义。标准术语提供对于领域知识的普遍理解,并且有助于进行有效的信息处理和在不同各方之间进行知识共享,因此术语服务器通常保持有大量数据。客户端按照应用中对术语的请求从术语服务器获取术语数据,以用于支持语义应用的执行。为了获得语义应用的更高性能和可扩展性,需要使用本地客户端存储装置对术语数据进行缓存,这样可以使得从术语服务器接收的术语数据能够继续用于后续的使用。
客户端存储装置中用于缓存术语数据的缓存空间是有限的,用户不可能将术语服务器中所有的术语数据缓存到客户端存储装置。为了能够更迅速地响应于请求对术语数据进行访问,并且尽量减少与术语服务器进行网络交互所消耗的资源,需要确定适当的缓存策略,主要包括:响应于某个术语请求从术语服务器获取什么数据进行缓存,以及以何种形式进行缓存。
传统的缓存技术,例如页面缓存和元组缓存不能满足对术语服务进行访问的要求。页面缓存和元组缓存使用静态定义的、具有固定长度的物理单元,而所请求的数据项直接利用物理页面或者元组标识符来指定。在面向术语服务的缓存中,需要对所定义的、具有基于术语的语义关系的数据项进行动态管理。这是因为术语数据的组成包括:概念,是针对一个事物的抽象的、普遍的想法和观念,词项(term)是概念的表现形式,一个概念可以用不同的词项表示;针对概念的属性,是该概念本身所具有的特性,特征,参数等,例如概念的属性包括用于命名该概念的词项以及该概念的其它属性;以及关系,表示概念之间的关联。通常用户请求术语数据中一个概念的信息,之后通常会接着请求与该概念依据关系相关联的另一概念的信息。因此,按照传统缓存技术缓存术语数据难以反映术语数据的语义关系,从而不能有效地响应语义应用的请求,表现为在系统中对缓存数据命中率的下降,客户端缓存数据本身冗余度过高等方面。
进一步地,术语概念之间的关系包括非传递性关系和传递性关系,其中传递性关系可以定义为:对于任意的概念A、B和C以及一个特定的关系r,已知r(A,B)和r(A,C),如果r(A,C)也成立,则关系r是传递性关系,例如“是一种”和“是一部分”是关联概念的传递性关系;而非传递性关系可以定义为:对于任意的概念A、B、和C和一个特定的关系r,已知r(A,B)和r(B,C),如果r(A,C)不成立,则关系r是非传递性关系,例如“相互作用”是关联概念的非传递性关系。
可以理解,对于传递性关系来说具体表现形式为:
Figure B2009101509658D0000021
Figure B2009101509658D0000022
则存在
Figure B2009101509658D0000023
在现有的缓存机制中无法体现不直接关联的概念之间存在的传递性关系,即概念A和概念C之间的关系。因此,无法有效响应涉及传递性关系的请求,例如,客户端需要获取与给定概念通过一传递性关系相关联的所有概念的信息。
因此,出于术语服务的要求,需要在客户端用于对来自术语服务器的术语数据进行缓存的新方案。
发明内容
为了克服现有技术中的缺陷,本发明提出一种用于缓存术语数据的方法和系统。
根据本发明的第一方面,提供一种用于缓存术语数据的方法,包括。该方法包括以下步骤:接收术语请求;确定该术语请求与至少一个未被缓存的术语概念有关;获取该术语概念的完全概念集作为缓存单元,其中该完全概念集包括该术语概念、与该术语概念通过非传递性关系直接关联或间接关联的其他所有术语概念、各术语概念的属性、以及各术语概念之间的非传递性关系;针对该完全概念集,获取传递性关系信息,该传递性关系信息至少包括与该完全概念集中的每个术语概念通过传递性关系关联的术语概念的标识;以及对该缓存单元和该缓存单元的该传递性关系信息进行缓存。
根据本发明的第二方面,提供一种用于缓存术语数据的装置。该装置包括:用于接收术语请求的装置;用于确定该术语请求与至少一个未被缓存的术语概念有关的装置;用于获取该术语概念的完全概念集作为缓存单元的装置,其中该完全概念集包括该术语概念、与该术语概念通过非传递性关系直接关联或间接关联的其他所有术语概念、各术语概念的属性、以及各术语概念之间的非传递性关系;用于针对该完全概念集获取传递性关系信息的装置,该传递性关系信息至少包括与该完全概念集中的每个术语概念通过传递性关系关联的术语概念的标识;以及用于对该缓存单元和该缓存单元的该传递性关系信息进行缓存。
根据本发明的技术方案,能够使得缓存术语数据在很大程度上反映术语数据的语义关系,从而能够有效地响应语义应用的术语请求,显著提高术语服务系统中对缓存数据命中率。而且,根据本发明的技术方案能够减少为了获取术语数据的语义关系而与术语服务器进行的网络交互,并降低客户端缓存的术语数据的冗余度。
附图说明
通过以下结合附图的说明,并且随着对本发明的更全面了解,本发明的其他目的和效果将变得更加清楚和易于理解,其中:
图1示意性示出根据本发明一个实施例的对术语数据进行缓存的系统;
图2示意性示出根据本发明一个实施例对术语数据进行缓存的方法的流程图;
图3示出一个术语数据的结构的示例;
图4示意性示出根据本发明一个实施例对术语数据进行缓存的数据形式;
图5示意性示出根据本发明一个实施例对术语数据进行缓存的附加数据形式;
图6示意性示出根据本发明一个实施例处理语义应用客户端的术语请求的流程图;
在所有的上述附图中,相同的标号表示具有相同、相似或相应的特征或功能。
具体实施方式
图1示意性示出根据本发明一个实施例的对术语数据进行缓存的系统。
如图1所示,根据本发明一个实施例的对术语数据进行缓存的系统包括客户端侧的语义应用客户端10、用于缓存术语数据的客户端存储装置11、用于对术语数据的缓存进行管理的缓存管理装置12,以及服务器侧的术语服务器20、术语服务器存储装置21。
语义应用客户端10发出术语请求。响应于该术语请求,缓存管理装置12在客户端存储装置11中缓存的术语数据中查询该术语请求针对的术语数据。如果相应的术语数据项已经被缓存在客户端存储装置11中,则缓存管理装置12直接将查询结果返回给语义应用客户端10。如果该术语请求针对的术语数据未缓存在于客户端存储装置11中,则缓存管理装置12向术语服务器20请求获取相关的术语数据,并将所获得的数据以一定数据形式缓存到客户端存储装置11中,并将获得的查询结果返回给语义应用客户端10。
如在前文中所述,术语数据的组成包括:概念;针对概念的属性,包括用于命名该概念的词项以及该概念的其它属性;以及关系,表示概念之间的关联。而且术语数据概念之间的关系可以是非传递性关系,也可以是传递性关系。因此,缓存管理装置12需要使得所获取的、用于缓存的术语数据本身以及对术语数据进行缓存的数据形式能够反映术语数据的语义关系,从而支持更迅速地响应于请求对术语数据进行访问,并且尽量减少与术语服务器进行网络交互所消耗的资源。
本发明的发明人已经意识到如下事实:在术语服务中总是针对彼此相关联的术语概念进行连续请求;一个术语概念仅具有少量通过非传递性关系与之直接相关联的概念,而且间接非传递性关系的深度是有限的,通常小于5。
基于这样的事实,本发明提出一种用于对术语数据进行缓存的方法。例如,该方法可以由图1所示的缓存管理装置12执行,从而满足访问术语数据的要求。
图2示意性示出根据本发明一个实施例对术语数据进行缓存的方法的流程图。
如图2所示,在步骤S200中,该方法流程开始。
在步骤S201中,接收术语请求。例如,缓存管理装置12接收到来自语义应用客户端10的术语请求。该术语请求例如可以包括:关于某个术语概念的请求、关于某个词项的请求、关于某个关系涉及的术语概念的请求、关于两个词项的请求等等。术语请求的种类和具体内容取决于语义应用客户端10所支持的语义应用的需求。然而,无论何种请求最终都能分解为对术语数据最小成分的查询,即术语概念和术语概念之间的关系。因此,对于本发明来说,适用于本文提到或者本文未提到的任何类型的术语请求。
在步骤S202中,确定该术语请求与至少一个未被缓存的术语概念有关。缓存管理装置12在客户端存储装置11中缓存的术语数据中查询该术语请求针对的术语数据。如果命中,则返回查询结果;如果未命中,则确定所接收的术语请求与至少一个未被缓存的术语概念有关。该确定步骤通常可以仅通过缓存管理装置12与客户端存储装置11之间的交互就可以实现。在某些特定情况下,该确定步骤也可以包括缓存管理装置12与术语服务器20之间的交互。例如,当术语请求的输入为关系,从而要求获取所关联术语概念时,则缓存管理装置12需要与术语服务器20进行交互以获取相关联术语概念的信息,如果存在至少一个术语概念未在客户端存储装置11中进行缓存,则确定所接收的术语请求与该至少一个未被缓存的术语概念有关。
在步骤S203中,获取该术语概念的完全概念集作为缓存单元。未被缓存的术语概念的完全概念集包括该术语概念本身、与该术语概念通过非传递性关系直接关联或间接关联的其他所有术语概念、各术语概念的属性、以及各术语概念之间的非传递性关系。在一种具体实现中,缓存管理装置12按照完全概念集的内容要求向术语服务器20发出术语请求。响应于该缓存管理装置12所发送的术语请求术语服务器20将相应的术语数据提供到缓存管理装置12。缓存管理装置12将接收到的关于该完全概念集的术语数据作为一个缓存单元。该缓存单元可以具有一定的数据形式,例如树形结构,以表示所包含术语数据。
在步骤S204中,针对该完全概念集,获取传递性关系信息。该传递性关系信息至少包括与该完全概念集中的每个术语概念通过传递性关系关联的术语概念的标识。实际上,传递性关系可以包括多种具体传递性关系,例如,“是”,“属于”,“传播到”等等,如果在术语数据中同时存在多种传递性关系,则需要为每个数据概念、针对每个具体传递性关系获取通过该传递性关系关联的数据概念。在一种实施例中,缓存管理装置12向术语服务器20发出术语请求,为完全概念集中的每个术语概念获取与其通过传递性关系直接关联的术语概念。传递性关系信息可以具有一定的数据形式,例如表格,以指示完全概念集中每个术语概念与所获得的与其通过传递性关系直接关联的术语概念之间的对应关系。这里需要指出的是,在传递性关系信息中并不需要获取通过传递性关系关联的术语概念的各种属性,只需要记录该术语概念的标识。因此,完全概念集的传递性关系信息将不会占用很大的缓存空间。
在步骤S205中,对该缓存单元和该缓存单元的该传递性关系信息进行缓存。缓存管理装置12将所获取的完全概念集作为缓存单元缓存到客户端存储装置11。因此,缓存单元作为缓存更新的基本单元其大小是动态可变的。缓存管理装置12为每个缓存单元同时缓存该完全概念集的传递性关系信息,当缓存单元更新时,传递性关系信息也随之更新。
在步骤206中,该方法流程结束。
本领域技术人员可以理解,由于通过作为缓存单元的完全概念集在客户端存储装置11中缓存了关于术语概念和其之间的非传递性关系的术语数据,并且通过在客户端存储装置11中针对每个缓存单元维持该完全概念集的传递性关系信息,这些缓存的术语数据能够在很大程度上反映术语数据的语义关系,由此大大减少了为获取术语数据的语义关系而与术语服务器进行的网络交互。而且,缓存单元和非传递性关系信息占用的缓存空间是有限,能够在有限的缓存空间中提供更多、更有效的信息。
以下将参照附图3-5具体说明根据本发明一个实施例对术语数据进行缓存的具体数据形式。
图3示出一个术语数据的结构的示例。该术语数据的结构可以是维护在术语服务器存储装置21中的术语片段。如图3所示,该术语数据的结构包括根节点以及多个作为其后代节点的术语概念。术语概念之间通过传递性关系或非传递性关系相关联,其中在图3中传递性关系以虚线箭头示出,而非传递性关系以实线箭头示出。例如术语概念C7通过非传递性关系直接与术语概念C9和C10关联,并且进而间接与术语概念C8和C12关联。此外,术语概念C7还通过传递性关系与其它术语概念(未示出)相关联。
图4示意性示出根据本发明一个实施例对术语数据进行缓存的数据形式。
如图4所示,缓存的数据形式包括作为缓存单元的完全概念集和针对每个缓存单元的传递性关系信息。在该示例中,作为缓存单元的完全概念集以树形结构表示,而传递性关系信息以表的形式表示。本领域技术人员可以理解,还可以使用任何可能的数据形式来表示完全概念集和传递性关系信息。所采用的具体数据形式不对本发明构成限制。
图4所示出的缓存术语数据是对如图3所示的维护在术语服务器存储装置21中的术语片段一种可能的数据缓存。对术语数据的缓存是响应于术语请求而进行的,因此对于术语服务器端相同的术语结构,在客户端侧可能产生不同的缓存内容。图4仅示出一种可能的缓存内容。
缓存单元1和针对缓存单元1的传递性关系信息表是应术语请求而获取并进行缓存的。该术语请求与术语概念C1有关,而术语概念C1在进行该术语请求之时并未缓存在客户端存储装置11中。从图3所示的维护在术语服务器存储装置21中的术语片段可以看到,与术语概念C1通过非传递性关系直接关联的术语概念包括C3、C4、C2,进一步通过非传递性关系间接关联的术语概念还包括C5、C6(与C2直接关联)。这样术语概念C1-C6构成术语概念C1的完全概念集。缓存管理装置12从术语服务器20获取术语概念C1-C6、C1-C6各自的全部属性,以及C1-C6之间的非传递性关系,作为缓存单元1进行缓存。其中术语概念C1是该缓存单元1的根节点,其具有为0的入度。
另一方面,从图3所示的维护在术语服务器存储装置21中的术语片段还可以看到,术语概念C1-C6中的某些术语概念还存在传递性关系。术语概念C1通过传递性关系关联到术语概念C8和Cy;术语概念C6通过传递性关系关联到C10。缓存管理装置12针对作为缓存单元1的该完全概念集从术语服务器20获取上述传递性关系信息,作为针对缓存单元1的传递性信息表进行缓存。在图4所示的示例中,传递性关系信息仅包括通过传递性关系直接关联的术语概念的标识,即紧接的孩子术语概念的标识(ID)。在其它实施例中也可以进一步显示下一级或下n级(n有限)间接关联的术语概念的标识。此时,需要使得该传递性信息表维持在有限的、合理的数据大小,从而在提高访问缓存术语数据速度的同时兼顾对缓存空间的占用问题。
类似地,缓存单元2和针对缓存单元2的传递性关系信息表是应术语请求而获取并进行缓存的。该术语请求与术语概念C7有关,而术语概念C7在进行该术语请求之时并未缓存在客户端存储装置11中。缓存单元2包括术语概念C7的完全概念集C7-C10、C12,术语概念C7-C10、C12各自的全部属性,以及C7-C10、C12之间的非传递性关系。针对作为缓存单元2的该完全概念集的传递关系信息表指示了C7-C10、C12中存在的非传递性关系。
应注意到传递性关系信息中所指示的、通过传递性关系关联的术语概念(显示在表格右栏)可以是尚未被缓存到客户端存储装置11的术语概念。例如,在图4所示的传递性关系信息表中,缓存单元1中包括的术语概念C1通过传递性关系关联到C8和Cy,其中Cy不属于当前已经缓存的任何一个缓存单元,其还未被加载到缓存。当任何术语请求涉及到术语概念Cy时,缓存管理装置12可以为Cy请求其完全概念集作为新的缓存单元加载到缓存。
需要指出的是,虽然出于简便的目的,在图4中仅概括的表示为“传递性关系”,但实际上,传递性关系可以包括多种具体传递性关系,例如,“是”,“属于”,“传播到”等等。如果在术语数据中同时存在多种传递性关系,则需要为在传递性关系信息中为每个数据概念、针对涉及该概念的每个具体传递性关系指示通过该传递性关系关联的数据概念。
图5示意性示出根据本发明一个实施例对术语数据进行缓存的附加数据形式。通过使用这些附加数据形式使得在如图4所示的基本数据形式基础上,能够更快速和便捷地访问所缓存的术语数据。
在一个示例中,该附加数据形式可以包括术语概念索引信息。该术语概念索引信息可以以表的形式为所有缓存单元生成,用于表示当前已经缓存的术语概念和其所属的缓存单元之间的对映关系。响应于术语请求,缓存管理装置12通过查找该表就可以确定所要查询的术语概念属于哪个缓存单元,从而提高命中率。
在又一示例中,该附加数据形式还可以包括词项概念映射信息。该词项概念映射信息可以实现为表的形式,用于表示词项与术语概念之间的映射关系。如前所述,词项是术语概念的一个属性,用于对术语概念进行命名。同一词项可能作为多个术语概念的属性。术语请求可能直接关于词项。当术语请求关于特定词项时,虽然词项本身作为术语概念的属性之一已经通过缓存单元加载到缓存,但逐一查询属性概念的属性可能是费时的。因此,为了提高处理针对词项的术语请求的效率,在一种优选方案中可以缓存词项概念映射信息。
在又一示例中,该附加数据形式还可以包括逆传递性关系信息。该逆传递性关系信息可以实现为表的形式,用于表示与传递性关系信息所表示的反向的传递性关系。例如,如果传递性关系信息包括与术语概念通过传递性关系关联的紧接的孩子术语概念的标识(ID),则在相应逆传递性关系信息中可以包括该术语概念通过传递性关系关联的紧接的父亲术语概念的标识(ID)。由此可以在缓存中支持关于传递性关系的双方向地对术语概念进行访问。当在术语数据中包括多种具体传递性关系时,逆传递性关系信息应该对应于传递性关系信息,为每个数据概念、针对每个具体传递性关系指示通过该传递性关系关联的数据概念。
本领域的技术人员可以理解,可应用于本发明的用于缓存术语数据的附加数据形式不限于上文中仅描述的这些数据形式。还可以根据实际的需要构造各种用于提高缓存访问性能的附加数据形式,例如以其它指标对术语概念编制索引等。显然,由于描述缓存术语数据的信息的增加,使得访问缓存的效率得以提高,然而这种提高是以附加数据消耗缓存空间为代价的。这样的问题普遍存在于各种缓存技术中,在这里不再进行讨论。
图6示意性示出根据本发明一个实施例处理语义应用客户端的术语请求的流程图。在该示例中,表述了对关于一个术语概念的术语请求的处理流程。
如图6所示,该流程开始。
在步骤S601中,接收到来关于一个术语概念的术语请求。
在步骤S602中,确定该术语概念是否已经加载在缓存中。
如果在步骤S602中确定结果为“否”,则处理继续执行步骤S603;如果在步骤S602中确定结果为“是”,则处理继续执行步骤S606。
在步骤S603中,由于该术语概念未加载在缓存中,则从术语服务器获取所需的术语数据。根据本发明的一个实施例,例如按照如参照图2的步骤S203和S204步骤所表述的那样获取参照图4所表述的该术语概念的完全概念集和该完全概念集的传递性关系信息。根据本发明进一步实施例,可以进一步获取参照图5所描述的附加数据形式所需的信息,如逆传递性关系信息等。
由于获取了所有所需数据,在步骤S612中,返回查询结果。此时,在步骤S613中,该处理结束。
在步骤S604中,使用获取的数据生成新缓存单元。
在步骤S605中,利用新的缓存单元对客户端存储装置中的缓存进行更新,并对传递性关系信息进行相应的更新。此外,如果在缓存有附加数据形式的信息,例如术语概念索引信息、词项概念映射信息、逆传递性关系信息等,需要对这些信息同时进行更新。
缓存更新的策略可以按照缓存单元使用的频度、缓存单元使用的时间(是否最近使用过该缓存单元)等来确定。例如,当按照缓存单元的使用频度来更新缓存单元时,可以为每个缓存单元保存对其进行访问的次数,在更新时以新缓存单元替换具有最小访问次数的缓存单元。当按照缓存单元使用的时间来更新缓存单元时,可以为每个缓存单元保存最近对其访问的时间,在更新时以新缓存单元替换其最近访问时间最久远的缓存单元。当然,还可以使用任何适合的策略执行对缓存单元的更新。
在对缓存单元的更新中存在这样一种情况:所获得的作为新缓存单元的新完全概念集a的一个子节点(入度大于零),是作为当前加载的缓存单元的完全概念集b的根节点(入度为零)。则在这种情况下可以将完全概念集a合并到完全概念集b,作为新的缓存单元。对完全概念集进行合并有效地消除了缓存的术语数据中存在的不必要冗余,由此提高了缓存空间的利用率。
在步骤S606中,由于所请求的术语概念已经加载在缓存中,则例如在一种查询条件下从相关缓存单元中获取通过非传递性关系直接关联的术语概念信息。
在步骤S607中,从传递性关系信息中获取与该术语概念通过传递性关系信息相关的术语概念ID。
在步骤S608中,确定是否所有通过传递性关系信息相关的术语概念均已加载在缓存中。
如果在步骤S608中确定结果为“是”,则处理继续执行步骤S610;如果在步骤S608中确定结果为“否”,则处理继续执行步骤S609。
在步骤S609中,由于所需术语概念没有完全加载到缓存中,需要从术语服务器获取未加载的术语信息。由此,按照本发明一个实施例,例如按照如参照图2的步骤S203和S204步骤所描述的那样获取参照图4所描述的针对这些术语概念的完全概念集和该完全概念集的传递性关系信息。根据本发明进一步实施例,可以进一步获取参照图5所描述的附加数据形式所需的信息,如逆传递性关系信息等。接着,一方面处理继续执行步骤S604,对所获取的术语数据生成新的缓存单元,进而在步骤S605中对缓存单元进行更新。
在步骤S610中,获取所有所需的术语数据。如果在步骤S608中确定结果为“是”,则可以从缓存中获得所有所需的术语数据;如果在步骤S608中确定结果为“否”,则一方面从缓存中获得所需的术语数据,另一方面通过S609获得了其余的所需术语数据。
在步骤S611中,返回查询结果。此时,在步骤S613中,该处理结束。
提供本发明的说明书的目的是为了说明和描述,而不是用来穷举或将本发明限制为所公开的形式。对本领域的普通技术人员而言,许多修改和变更都是显而易见的。本领域技术人员还应该理解,可以通过软件、硬件、固件或者它们的结合的方式,来实现本发明实施例中的方法和装置。
因此,选择并描述实施方式是为了更好地解释本发明的原理及其实际应用,并使本领域普通技术人员明白,在不脱离本发明实质的前提下,所有修改和变更均落入由权利要求书所限定的本发明的保护范围之内。

Claims (14)

1.一种用于缓存术语数据的方法,包括:
接收术语请求;
确定该术语请求与至少一个未被缓存的术语概念有关;
获取该术语概念的完全概念集作为缓存单元,其中该完全概念集包括该术语概念、与该术语概念通过非传递性关系直接关联或间接关联的其他所有术语概念、各术语概念的属性、以及各术语概念之间的非传递性关系;
针对该完全概念集,获取传递性关系信息,该传递性关系信息至少包括与该完全概念集中的每个术语概念通过传递性关系关联的术语概念的标识;
对该缓存单元和该缓存单元的该传递性关系信息进行缓存。
2.根据权利要求1所述的方法,其中,该传递性关系信息至少包括与该完全概念集中的每个术语概念通过传递性关系直接关联的术语概念的标识。
3.根据权利要求1所述的方法,还包括生成术语概念索引信息,用于表示当前已经缓存的所述完全概念集中的每个术语概念和其所属的缓存单元之间的对应关系。
4.根据权利要求1所述的方法,其中所述术语概念的属性包括词项,
所述方法还包括获取词项概念映射信息,用于表示词项与术语概念之间的映射关系。
5.根据权利要求1所述的方法,还包括获取逆传递性关系信息,用于表示与传递性关系信息所表示的传递性关系反向的传递性关系,其中若传递性关系信息包括与术语概念通过传递性关系关联的紧接的孩子术语概念的标识,则在逆传递性关系信息中包括术语概念通过传递性关系关联的紧接的父亲术语概念的标识,反之亦然。
6.根据权利要求1所述的方法,还包括利用获得的缓存单元对当前缓存的数据进行更新,并对传递性关系信息进行相应的更新。
7.根据权利要求6所述的方法,还包括将作为缓存单元而获得的完全概念集与作为当前缓存的缓存单元的完全概念集进行合并,作为新的缓存单元。
8.一种用于缓存术语数据的装置,包括:
用于接收术语请求的装置;
用于确定该术语请求与至少一个未被缓存的术语概念有关的装置;
用于获取该术语概念的完全概念集作为缓存单元的装置,其中该完全概念集包括该术语概念、与该术语概念通过非传递性关系直接关联或间接关联的其他所有术语概念、各术语概念的属性、以及各术语概念之间的非传递性关系;
用于针对该完全概念集获取传递性关系信息的装置,该传递性关系信息至少包括与该完全概念集中的每个术语概念通过传递性关系关联的术语概念的标识;
用于对该缓存单元和该缓存单元的该传递性关系信息进行缓存的装置。
9.根据权利要求8所述的装置,其中,该传递性关系信息至少包括与该完全概念集中的每个术语概念通过传递性关系直接关联的术语概念的标识。
10.根据权利要求8所述的装置,还包括用于生成术语概念索引信息的装置,该术语概念索引信息用于表示当前已经缓存的所述完全概念集中的每个术语概念和其所属的缓存单元之间的对应关系。
11.根据权利要求8所述的装置,还包括用于获取词项概念映射信息的装置,该词项概念映射信息用于表示词项与术语概念之间的映射关系,其中所述术语概念属性包括词项。
12.根据权利要求8所述的装置,还包括用于获取逆传递性关系信息的装置,该逆传递性信息用于表示与传递性关系信息所表示的传递性关系反向的传递性关系,其中若传递性关系信息包括与术语概念通过传递性关系关联的紧接的孩子术语概念的标识,则在逆传递性关系信息中包括术语概念通过传递性关系关联的紧接的父亲术语概念的标识,反之亦然。
13.根据权利要求8所述的装置,还包括用于利用获得的缓存单元对当前缓存的数据进行更新,并对传递性关系信息进行相应的更新的装置。
14.根据权利要求13所述的装置,还包括用于将作为缓存单元而获得的完全概念集与作为当前缓存的缓存单元的完全概念集进行合并以作为新的缓存单元的装置。
CN2009101509658A 2009-06-29 2009-06-29 用于缓存术语数据的方法和系统 Pending CN101937442A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2009101509658A CN101937442A (zh) 2009-06-29 2009-06-29 用于缓存术语数据的方法和系统
US12/824,357 US8301841B2 (en) 2009-06-29 2010-06-28 Method and system for caching terminology data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009101509658A CN101937442A (zh) 2009-06-29 2009-06-29 用于缓存术语数据的方法和系统

Publications (1)

Publication Number Publication Date
CN101937442A true CN101937442A (zh) 2011-01-05

Family

ID=43390776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101509658A Pending CN101937442A (zh) 2009-06-29 2009-06-29 用于缓存术语数据的方法和系统

Country Status (2)

Country Link
US (1) US8301841B2 (zh)
CN (1) CN101937442A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559307A (zh) * 2013-11-18 2014-02-05 中国农业银行股份有限公司 一种查询的缓存方法及装置

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2852101A1 (en) * 2010-07-28 2012-01-28 Wairever Inc. Method and system for validation of claims against policy with contextualized semantic interoperability
US8527451B2 (en) 2011-03-17 2013-09-03 Sap Ag Business semantic network build
US20120239381A1 (en) 2011-03-17 2012-09-20 Sap Ag Semantic phrase suggestion engine
US8725760B2 (en) * 2011-05-31 2014-05-13 Sap Ag Semantic terminology importer
US8935230B2 (en) 2011-08-25 2015-01-13 Sap Se Self-learning semantic search engine
GB2503266A (en) * 2012-06-21 2013-12-25 Ibm Sharing aggregated cache hit and miss data in a storage area network
US10304007B2 (en) * 2015-12-08 2019-05-28 International Business Machines Corporation Using a plurality of heterogeneous decision engines to produce a single decision

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0961210A1 (en) * 1998-05-29 1999-12-01 Xerox Corporation Signature file based semantic caching of queries
US6636950B1 (en) * 1998-12-17 2003-10-21 Massachusetts Institute Of Technology Computer architecture for shared memory access
US20020078300A1 (en) * 1999-08-16 2002-06-20 Chanda Dharap Semantics-based caching policy to minimize latency
US7266790B2 (en) * 2003-03-07 2007-09-04 Cadence Design Systems, Inc. Method and system for logic equivalence checking
US20060074980A1 (en) * 2004-09-29 2006-04-06 Sarkar Pte. Ltd. System for semantically disambiguating text information
US20070130112A1 (en) * 2005-06-30 2007-06-07 Intelligentek Corp. Multimedia conceptual search system and associated search method
CA2695535A1 (en) * 2007-08-07 2009-02-12 The Research Foundation Of Suny Referent tracking of medical measures as portions of reality

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559307A (zh) * 2013-11-18 2014-02-05 中国农业银行股份有限公司 一种查询的缓存方法及装置

Also Published As

Publication number Publication date
US8301841B2 (en) 2012-10-30
US20110022798A1 (en) 2011-01-27

Similar Documents

Publication Publication Date Title
US20210044662A1 (en) Server side data cache system
CN101937442A (zh) 用于缓存术语数据的方法和系统
US20240020295A1 (en) Incremental refresh of a materialized view
CN107025243A (zh) 一种资源数据的查询方法、查询客户端和查询系统
CN101576918B (zh) 具备负载均衡功能的数据缓存系统
CN102971732B (zh) 键/值存储器的集成分级查询处理的系统结构
CN102542034B (zh) 一种数据库接口的结果集缓存方法
Payne Library storage facilities and the future of print collections in North America
CN103177117B (zh) 信息索引系统及信息索引的更新方法
US20050203887A1 (en) System and method for seamless access to multiple data sources
US9342572B2 (en) Workflow processing system and method with database system support
US20150095308A1 (en) Background format optimization for enhanced sql-like queries in hadoop
CN100437590C (zh) 预取对象的方法
US20110208793A1 (en) Method and system for managing data transaction requests
CN102867070A (zh) 更新key-value分布式存储系统缓存的方法
CN101510209A (zh) 实现实时检索的方法、系统和服务器
CN101655871A (zh) 一种数据存储、查询方法和装置
JP2011516983A5 (zh)
WO2022062184A1 (zh) 高并发查询方法、智能终端及存储介质
CN105635196A (zh) 一种获取文件数据的方法、系统和应用服务器
CN105574051A (zh) 更新用户所满足的规则的方法及处理系统
CN103886038A (zh) 数据缓存方法及装置
CN101404649B (zh) 一种基于cache的数据处理系统及其方法
JP2002099565A (ja) 情報検索装置
CN106484694B (zh) 基于分布式数据库的全文搜索方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20110105