CN101636760A - 管理分类系统的词汇表检索词的技术 - Google Patents

管理分类系统的词汇表检索词的技术 Download PDF

Info

Publication number
CN101636760A
CN101636760A CN200880004076A CN200880004076A CN101636760A CN 101636760 A CN101636760 A CN 101636760A CN 200880004076 A CN200880004076 A CN 200880004076A CN 200880004076 A CN200880004076 A CN 200880004076A CN 101636760 A CN101636760 A CN 101636760A
Authority
CN
China
Prior art keywords
vocabulary term
vocabulary
term
informal
decision parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200880004076A
Other languages
English (en)
Inventor
D·E·考甘
P·C·米勒
V·塔拉诺弗
M·K·皮亚塞茨尼
L·安东诺夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN101636760A publication Critical patent/CN101636760A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/328Management therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

描述了管理分类系统的词汇表检索词的技术。一装置可包括受管分类系统,该受管分类系统具有管理以分层结构组织的正式词汇表检索词的分类的词汇表管理模块。该分类可包括存储为关键字列表的非正式词汇表检索词的类别。对其它实施例也予以描述并要求保护。

Description

管理分类系统的词汇表检索词的技术
背景
受管分类系统管理针对应用程序、设备或网络的分类。分类试图定义公共或标准词汇表,以供与应用程序或系统交互。该标准词汇表然后可以用于诸如归类应用程序、搜索应用程序、加标签应用程序等不同的应用程序。为了创建标准词汇表,受管分类系统试图建立并管理高度结构化且形式化的标准词汇表检索词分层结构。然而,受管分类系统通常难以维护和管理,尤其是跨异构系统之来维护和管理。新词汇表检索词的引入经常包括分类管理器的正式审阅和接受。然而,当系统拥有大量用户时,新词汇表检索词的数量可能快速摧垮这样的正式过程。此外,高度结构化的分类系统经常很刚性,因而不能迅速适应于对诸如因特网等在线应用而言普遍的词汇表的新使用情况或改变。因此,存在对用于管理受管分类系统的词汇表检索词的改进的技术的需求。
概述
提供本概述是为了以简化的形式介绍将在以下详细描述中进一步描述的一些概念。本概述并不旨在标识出所要求保护的主题的关键特征或必要特征,也不旨在用于限定所要求保护的主题的范围。
各实施例一般针对管理受管分类系统的词汇表检索词的技术。特别地,某些实施例可以针对用于管理受管分类系统管理的非正式词汇表检索词的技术。例如,在一实施例中,诸如受管分类系统等装置可以包括词汇表管理模块,该模块管理以分层结构组织的正式词汇表检索词的分类。该分类可包括为存储为关键字列表的非正式词汇表检索词定义的类别。以此方式,受管分类系统可以向非正式词汇表检索词给予允许非正式词汇表检索词由受管分类系统来管理的基本结构,从而允许非正式词汇表检索词有机会基于各种判决准则随时间发展成正式词汇表检索词。对其它实施例也予以描述并要求保护。
附图简述
图1示出了受管分类系统的一实施例。
图2示出了受管分类的一实施例。
图3示出了逻辑流程的一实施例。
图4示出了计算系统结构体系的一实施例。
详细描述
各实施例可以包括一个或多个元素。元素可以包括与实施例相结合描述的任何特征、特性、结构或操作。元素的示例可以包括硬件元素、软件元素、物理元素或其任何组合。尽管一实施例可以作为示例被描述为具有以某种方式排列的有限数量的元素,但该实施例可以视给定实现所需包括以替换方式排列的更多或更少的元素。值得注意的是,对“一个实施例”或“一实施例”的引用不必指相同的实施例。
各实施例一般针对管理受管分类系统的词汇表检索词的技术。分类一般可以指用于对信息或数据进行归类的结构、方法或技术。分类通常由分类单元组成,分类单元单数时称为单数分类单元(taxon)而复数时称为复数分类单元(taxa)。在各实施例中,单数分类单元可包括一个或多个词汇表检索词,而复数分类单元可包括为给定系统定义的词汇表检索词的整个集合。词汇表检索词可以包括各种类型,包括正式词汇表检索词和非正式词汇表检索词。受管分类可以指按照针对给定系统的一组正式规则、过程或方针来管理的分类。受管分类系统可以是被安排成存储、处理、传送和以其它方式管理为电子系统或电子系统的集合定义的分类的任何系统。
更特别地,各实施例可以针对用于管理受管分类系统的非正式词汇表检索词的技术。非正式词汇表检索词一般指未在分类分层结构中正式接受就被引入到受管分类系统中的新词汇表检索词。受管分类系统可以为非正式词汇表检索词提供某一基本结构。该基本结构通常小于给予正式词汇表检索词的正式结构。例如,该基本结构可以是为非正式词汇表检索词特别定义的类别。在某些实施例中,该特别定义的类别可以被称作“混合”类别。受管分类系统可使用该混合类别来执行针对非正式词汇表检索词的基本分类管理操作,同时减少或避免按照为受管分类系统实现的正式审阅过程来处理非正式词汇表检索词的需要。
作为对比,正式词汇表检索词一般可指已经通过正式审阅过程以完全接受到分类分层结构中的词汇表检索词。受管分类系统可以审阅词汇表检索词以接受到受管分类中。正式审阅过程的一部分可以包括标识候选词汇表检索词是否在分类的分层组织中具有逻辑位置。例如,如果一分类被组织为树状分层结构,则受管分类系统可将正式词汇表检索词排列成具有至父和/或子节点的链接的节点。受管分类系统可以采用某些语义和句法规则来确定候选词汇表检索词在此刚性分层结构中的适当位置。受管分类系统还可以为正式词汇表检索词定义某些特性或特征,诸如句法规则、与特定资源或数据对象的关联、与其它正式词汇表检索词的等同性关系或其同义词、与其它正式词汇表检索词的本体关系、上下文等等。受管分类系统的正式审阅和接受过程的数量和类型实际上是无限制的,且可以根据实现而不同。
在某些情况中,通常为受管分类系统实现的正式审阅和接受过程在动态系统环境中可造成各种问题。这样的正式过程经常由有时被称为分类学者的人类管理员来执行。在某些情况中,正式过程可由具有某些规则集、试探法、模糊逻辑、参数等等的应用程序来自动化。在这两种情况中,正式过程可能充当了将新词汇表检索词引入受管分类中的潜在瓶颈。对于拥有大用户量的系统,尤其是跨异构系统或平台的系统,词汇表检索词的变化量和变化率可能呈指数。因此,为每个词汇表检索词实现正式审阅规程的需要可能较大地影响受管分类系统处理和管理新词汇表检索词的流入或现有词汇表检索词中的变化的能力。
各实施例可试图解决这些或其它潜在问题。例如,在一实施例中,受管分类系统可包括,管理受管分类的多个词汇表检索词的词汇表管理模块。词汇表管理模块可包括用于存储非正式词汇表检索词的混合类别。混合类别的一个示例可包括分层类别,该分层类别将非正式词汇表检索词作为关键字的平面列表来包括。非正式词汇表检索词可包括与给定资源相关联的任何新词汇表检索词。在受管分类中,非正式词汇表检索词通常与正式词汇表检索词没有任何先前定义的关系。然而,受管分类系统可以使词汇表检索词基于使用和其它判决准则随着时间的过去发展成正式词汇表检索词。例如,对具有某些数据集的非正式词汇表检索词的增加使用可展现与受管分类系统内的正式词汇表检索词的关系。以此方式,可以向新词汇表检索词给予某一基本结构以便随受管分类系统一起使用,且对非正式词汇表检索词的使用和定义可基于非正式词汇表检索词的使用随时间而变得更正式化。从而,受管分类系统可足够稳健以响应随时间而发生的词汇表使用的变化。
图1示出了受管分类系统100的框图。受管分类系统100可以代表被安排成存储、处理、传送和以其它方式管理电子系统或电子系统的集合的已定义分类或受管分类的任何系统。如图1所示,受管分类系统100的一实施例可包括词汇表管理模块102、词汇表指派模块104、词汇表关联模块106、词汇表分析模块108、以及词汇表数据库110。
此处所使用的术语“模块”可以包括使用硬件元素、软件元素、或硬件与软件元素的组合实现的任何结构。例如,在一实施例中,此处所描述的模块通常被实现为存储在存储器中并由处理器执行以完成某些定义的操作的软件元素。然而可以理解,视给定实现的需要,定义的操作可以使用更多或更少模块来实现。还可以理解,根据各种设计和性能约束,定义的操作可以使用硬件元素来实现。各实施例在此上下文中不受限制。
在各实施例中,受管分类系统100可以用来管理任何定义的分类。诸如公司、商业机构或企业等实体可以使用不同的应用程序来跨实体管理信息。针对一实体的词汇表和分类经常随实体类型以及一组给定的产品和/或服务而变化。例如,在一实施例中,受管分类系统100可以用管理针对在有时被称为在线环境的计算和/或通信环境内操作的实体的特定词汇表检索词。在此上下文中,这样的词汇表检索词有时被称为“元数据”。元数据可以指描述信息承载实体的特性以有助于对所描述实体的标识、发现、评估和管理的结构化已编码数据。一般而言,一组元数据描述被称为资源的单个对象或数据集。元数据可特别用于如信息检索、信息编目以及语义web等应用程序。例如,词汇表检索词可以是被用作加标签操作的标签的元数据。标签是被关联于或被指定给一条信息或资源的相关关键字或检索词。从而标签可以描述该资源并允许对该资源的基于关键字的归类。
对常规受管分类系统而言一个问题是将通常与加标签操作和其它“Web 2.0”应用程序相关联的词汇表非正式性与通常用于商业机构和企业系统的词汇表正式性相集成。标签通常由该项目的作者/创建者非正式地且个人地选择,并且通常不是某个正式定义的归类方案的一部分。相反,标签通常在用于在线资源的动态的、灵活的、自动生成的因特网分类中使用,诸如计算机文件、网页、数字图像以及因特网书签。然而,商业机构或企业通常使用域专用本体来定义其词汇表。用于商业机构或企业的受管分类系统因此可能在平衡增长的创造性与商业环境中所需的确定性中面对相当大的挑战。
系统的词汇表结构可以更多地被视为连续集而非一系列离散的二元选择。在该连续集的一端没有受管词汇表。人们可以将关键字与文档相关联,但没有合适的系统来使用这些关键字。搜索只由全文本爬行(crawling)组成。在下一级处,词汇表是关键字的平面列表,该平面列表是用户可从中选择检索词的公用井。取决于围绕此词汇表的基础结构,仍可获得此系统之外的某些有用特征。公司内的不同应用程序可以使用相同的语义语言,这可允许这些不同的系统彼此通信。另一级是跟踪该词汇表中各种检索词之间的某种关系。这些关联最有可能从由计算机而非实际的人进行的某种算法处理中得到。还有另一级是定义先前的关联,诸如等同性关系。等同性关系可以包括该词汇表中被推入自定义同义词库或词典的商业机构专用同义词。当产品通过具有不同名称的各种具体化产物时,或者当企业内的两个不同的开发团队尝试并将其各自的词汇表合并成单个共享词汇表时,这可能有用。还有另一级可包括如先前所述的分类。最后,该连续集的另一端可以是将命名关系添加到词汇表的本体词汇表。像“与……竞争”或“制造”之类的关系给予系统的其余部分甚至更大量的信息。在这一点上,不再需要知道正在搜索什么来找到要查找的对象。例如,可以在先前没有特定的背痛药疗法的知识的情况下执行对“背痛药疗法”的搜索。
在各实施例中,受管分类系统100试图在此词汇表结构连续集内操作。更具体而言,受管分类系统100试图提供由资源作者或创建者生成的非正式词汇表检索词(例如,用于加标签操作)与构成通常用来为商业机构或企业操作定义词汇表的域专用本体的一部分的正式词汇表检索词之间较高层集成。受管系统100可以用用于词汇表管理的混合方法来设计,其中词汇表的某些区域被高度结构化,而词汇表的其它区域作为关键字的平面列表来管理。例如,涉及商业机构用的特定产品组及其相关联的产品的词汇表检索词可以相对直接,以便以定义的关系来放置在分层结构中。然而,涉及特定通用技术的词汇表检索词可能在给定商业机构内没有被充分使用来保证用关键字列表之外的方式管理它们的额外开销。此混合方法可使商业机构从基于非常宽松自由的系统开始向更结构化发展,且可能按其需要及复杂性保证来处理驱动的词汇表。多数公司将处于此混合状态,其词汇表的一些部分非常精炼,其中或数据趋于更简单地结构化,或某些业务部门需要这些数据(例如,公司组织图、法律检索词、市场检索词等等),而词汇表的其它区域可能较不结构化、具有较多关键字桶(bucket),其中关系通过算法分析或最终用户建议获得。
再次参考图1,受管分类系统100可以包括词汇表管理模块102。词汇表管理模块102可被安排成管理所词汇表数据库110存储的、用于受管分类112的词汇表检索词。受管分类112可以包括诸如正式词汇表检索词114-1-m和非正式词汇表检索词116-1-n等各种类型,其中m和n代表正整数。例如,在一实施例中,词汇表管理模块102可以按照正式词汇表检索词为分层结构的方式来组织受管分类112。词汇表管理模块102还可以为存储为关键字列表的非正式词汇表检索词116-1-n创建和维护混合类别分类。示例性受管分类112可参考图2来更详细地描述。
例如,在一实施例中,受管分类系统100可以包括词汇表指派模块104。只要非正式词汇表检索词116-1-n被引入受管分类系统100,词汇表管理模块102就可以用受管分类112的混合类别将非正式词汇表检索词116-1-n存储在词汇表数据库110中。词汇表管理模块102可以向词汇表指派模块104发送请求。词汇表指派模块104可被安排成将判决参数指派给非正式词汇表检索词116-1-n。一旦词汇表指派模块104将判决参数指派给信息词汇表检索词116-1-n,词汇表指派模块104就可将经指派的判决参数发送给词汇表分析模块108以便进行监视和分析操作。
例如,在一实施例中,受管分类系统100可以包括词汇表关联模块106。词汇表关联模块106可被安排成将非正式词汇表检索词与资源相关联。关联操作代表其中标签与给定资源相关联的加标签操作。例如,诸如图片等数据对象可以用诸如日期、时间、地点、摄影者、事件等等元数据来加标签。一旦非正式词汇表检索词116-1-n已被存储在词汇表数据库110中,词汇表管理模块102就可以向词汇表关联模块106发送消息来将非正式词汇表检索词116-1-n通知给词汇表关联模块106。用户接口或图形用户界面可以用来向用户呈现非正式词汇表检索词116-1-n的列表。用户可以选择一个或多个非正式词汇表检索词116-1-n,对所选非正式词汇表检索词116-1-n加标签或将其与资源相关联,并将用户标签/数据选择返回词汇表关联模块106。词汇表关联模块106可以将所选的非正式词汇表检索词116-1-n与资源之间的关联存储在词汇表数据库110中。
例如,在一实施例中,受管分类系统100可以包括词汇表分析模块108。词汇表分析模块108可被安排成分析非正式词汇表检索词116-1-n的判决参数。词汇表分析模块108可基于判决参数将非正式词汇表检索词116-1-n转换为正式词汇表检索词114-1-m。例如,词汇表分析模块108可基于非正式词汇表检索词116-1-n的使用将非正式词汇表检索词116-1-n转换为正式词汇表检索词114-1-m。或者,诸如分类管理员等人类可视给定实现所需基于判决参数或其它因素来将非正式词汇表检索词116-1-n转换为正式词汇表检索词114-1-m。
例如,在一实施例中,受管分类系统100可以包括词汇表数据库110。词汇表数据库110可以用来存储受管分类系统100的受管分类112。例如,在一实施例中,受管分类系统112可以被实现为通常显示父-子关系的各种类型的分层结构。尽管一实施例可以按照分层结构或组织来描述受管分类112,但受管分类112也可以被实现为具有各种拓扑结构的其它非分层结构,诸如网络结构、对象变为组或类的组织、字母顺序列表、关键字列表等等。各实施例在此上下文中不受限制。
图2示出受管分类112。例如,在一实施例中,受管分类112可以代表显示各种父-子关系的分层分类。分层分类是给定一组对象的归类的树状结构。其有时也被称为包含分层结构。在此结构的顶端是应用于所有对象的称为根节点的单个归类。根节点以下的节点是应用于全部已归类对象集的子集的更具体的归类。
如图2所示,受管分类112可包括各种归类节点202-1-p,其中p代表任何正整数。各种归类节点202-1-p可通过链接204-1-q连接在一起,其中q代表任何正整数,通常q代表p-1。归类节点202-1可以代表根节点,而节点202-2至202-6代表应用于全部已归类对象集的子集的更具体的归类。例如,根归类节点202-1可以代表医疗,而归类节点202-2、202-3从属于根归类节点202-1,并分别代表非手术医疗和手术医疗。在此情况中,根归类节点202-1可以代表父节点,而归类节点202-2、202-3可以代表子节点。继续此示例,从属于非手术医疗归类节点202-2的归类节点202-4、202-5可以代表诸如分别为物理疗法或药物疗法等不同类型的非手术医疗。在此情况中,非手术医疗归类节点202-2可以代表父节点,而归类节点202-4、202-5可以代表子节点。从而,当遍历受管分类112时,每个归类节点可具有与父节点和子节点的各种关系。这样的父-子关系允许受管分类系统100快速遍历并找到不同的归类节点。
在各实施例中,受管分类系统100的词汇表管理模块102可使用归类节点202-1至202-7来对受管分类112的正式词汇表检索词114-1-m进行归类。此外,词汇表管理模块102还可以维护由受管分类112的混合归类节点202-8所表示的混合类别。混合归类节点202-8可用来对具有各种非正式词汇表检索词116-1-n的非正式词汇表检索词列表206进行归类和管理。例如,在一实施例中,非正式词汇表检索词116-1-可以作为关键字的平面列表来维护。给定关键字可以通过顺次遍历非正式词汇表检索词116-1-直至找到所需非正式词汇表检索词116-1-来定位。
除信息词汇表检索词116-1-n之外,非正式词汇表检索词列表206还可维护对应于信息词汇表检索词116-1-n的各种判决参数208-1-s,其中s是正整数。例如,判决参数208-1-s可用来确定是否将非正式词汇表检索词116-1-n转换为正式词汇表检索词114-1-m。判决参数208-1-s可参考图3来更详细地描述。
将特别元数据值视为在本应正式管理的分类中使用混合归类节点202-8来归类的非正式词汇表检索词116-1-n允许元数据标签在其已开始用于加标签操作之后被跟踪、管理、相关、工作流化、映射和确保安全。混合归类节点202-8允许受管分类系统100具有将句法、关系和上下文添加到本来是检索词平面列表的部分中的灵活性。这允许特别元数据标签发展成受管分类112。此外,这样的特别元数据标签通常具有与标签相关联的相关性、使用或权重信息。受管分类系统100可使用这样的信息来确定多个非正式词汇表检索词116-1-n中的哪一个应该被折叠到受管分类112中。
装置100的操作还可以参考一个或多个逻辑流程来描述。可以理解,除非另外指明,否则代表性的逻辑流程不一定要按所呈现的顺序或者按任何特定顺序来执行。而且,关于逻辑流程描述的各种活动可按串行或并行的方式执行。视给定一组设计和性能约束所需,逻辑流程可使用装置100的一个或多个元素或替换元素来实现。
图3示出逻辑流程300。逻辑流程300可代表由在此所描述的一个或多个实施例执行的操作。如逻辑流程300中所示,在框302,逻辑流程300可将非正式词汇表检索词指派给受管分类的类别。在框304,逻辑流程300可将判决参数指派给所述非正式词汇表检索词。在框306,逻辑流程300可基于判决参数将非正式词汇表检索词转换为正式词汇表检索词。
例如,在一实施例中,在框302,词汇表指派模块104可将非正式词汇表检索词指派给受管分类的类别。词汇表管理模块104可接收新的非正式词汇表检索词116-1-n已被引入受管分类系统100的通知。词汇表指派模块104可将新的非正式词汇表检索词116-1-n存储或指派到混合归类节点202-8。然后,一旦新的非正式词汇表检索词116-1-n被指派给混合归类节点202-8,词汇表管理器模块102随后就可启动对该非正式词汇表检索词116-1-n的监视、分析和转换操作。
例如,在一实施例中,在框304,词汇表指派模块104可将判决参数208-1-s指派给非正式词汇表检索词116-1-n。判决参数208-1-s可以是被设计成测量非正式词汇表检索词的特性或特征以确定非正式词汇表检索词116-1-n是否是转换为正式词汇表检索词114-1-m的优良候选的任何参数。在各实施例中,判决参数208-1-s可包括使用参数、加权参数、关系参数、或相关性参数。判决参数的数量和类型根据实现而变化。
例如,在一实施例中,词汇表指派模块104可为非正式词汇表检索词116-1-n指派包括使用参数的判决参数208-1-s。使用参数可表示非正式词汇表检索词116-1-n与资源相关联的次数。使用参数可跟踪非正式词汇表检索词116-1-n与特定资源或受管分类系统可访问的任何资源相关联的次数。前一种情况可在辨别关系模式中特别有用,而后一种情况可包括用户总体对非正式词汇表检索词的总体接受的度量。例如,重复使用非正式词汇表检索词116-1-n来对诸如数字图像等给定资源类型加标签可以驱使分类学者将非正式词汇表检索词116-1-n变为作为数字图像的默认类别的正式词汇表检索词114-1-m(例如,版权符号)。
例如,在一实施例中,词汇表指派模块104可为非正式词汇表检索词116-1-n指派包括加权参数的判决参数208-1-s。加权参数可表示非正式词汇表检索词116-1-n或资源的优先级。加权参数可反映与非正式词汇表检索词116-1-n相关联的重要性或优先性的程度。例如,用户可将非正式词汇表检索词116-1-n指定为用于独特的或增长的商业趋势的检索词(例如,Web2.0)。
例如,在一实施例中,词汇表指派模块104可为非正式词汇表检索词116-1-n指派包括关系参数的判决参数208-1-s。关系参数可表示受管分类中非正式词汇表检索词116-1-n与正式词汇表检索词114-1-m之间的关系。例如,用户总体可重复使用非正式词汇表检索词116-1-n来对一资源加标签,该资源是与通过正式词汇表检索词114-1-m重复加标签的相同资源。这可以暗示非正式词汇表检索词116-1-n与正式词汇表检索词114-1-m之间的某种形式的关系,诸如父-子关系、等同性或同义词关系、本体关系、用户定义的关系等等。
例如,在一实施例中,词汇表指派模块104可为非正式词汇表检索词116-1-n指派包括相关性参数的判决参数208-1-s。相关性参数可表示与正式词汇表检索词116-1-n或资源的相关性级别。例如,诸如“焦距”或“快门速度”等与数字图像相关联的非正式词汇表检索词116-1-n可与偶尔摄影者、业余爱好或嗜好摄影者以及专业摄影师有不同的相关性级别。相关性参数可用于跟踪这样的细微差别。
例如,在一实施例中,在框306,词汇表管理模块102可基于判决参数208-1-s将非正式词汇表检索词116-1-n转换为正式词汇表检索词114-1-m。例如,词汇表分析模块108可为判决参数208-1-s定义阈值。词汇表分析模块108可将判决参数208-1-s与所定义的阈值进行比较。如果判决参数208-1-s超过所定义的阈值,则词汇表分析模块108就可向词汇表管理模块102发送信号、参数或消息,指示非正式词汇表检索词116-1-n已经准备好转换为正式词汇表检索词114-1-m。例如,假定判决参数208-1-s是使用参数。可定义阈值1000,并且当非正式词汇表检索词116-1-n用于加标签或搜索操作超过1000次时,词汇表管理模块102可对非正式词汇表检索词116-1-n启动进一步的分析操作或可能是转换操作。
例如,在一实施例中,词汇表管理模块102可以接收来自词汇表分析模块108的信号。词汇表管理模块102可启动将非正式词汇表检索词116-1-n转换为正式词汇表检索词114-1-m的正式过程。一旦转换为正式词汇表检索词,词汇表管理模块102就可将所转换的正式词汇表检索词插入到受管分类的正式词汇表检索词的分层结构中。此外,词汇表管理模块102可开始定义各种权限、属性、句法规则、等同性关系、本体关系、上下文参数等等,如同受管分类112内的任何正式词汇表检索词114-1-m一样。
图4示出了适用于实现包括受管分类系统100在内的各实施例的计算系统体系结构900的框图。可以理解,计算系统体系结构900只是合适的计算环境的一个示例,并不旨在对各实施例的使用范围或功能提出任何限制。也不应将计算系统体系结构900解释为对在示例性计算系统体系结构900中示出的组件中的任何一个或其组合有任何依赖或要求。
各实施例可在诸如程序模块等由计算机执行的计算机可执行指令的通用上下文中描述。一般而言,程序模块包括被安排成执行特定操作或实现特定抽象数据类型的任何软件元素。某些实施例也可以在其中操作由通过通信网络链接的一个或多个远程处理设备执行的分布式计算环境中实现。在分布式计算环境中,程序模块可以位于包括存储器存储设备在内的本地和远程计算机存储介质中。
如图4所示,计算机系统体系结构900包括诸如计算机910等通用计算设备。计算机910可以包括通常在计算机或处理系统中被找到的各种组件。计算机910的一些说明性组件可以包括但不限于处理单元920和存储器单元930。
例如,在一实施例中,计算机910可以包括一个或多个处理单元920。处理单元920可以包括被安排成处理信息或数据的任何硬件元素或软件元素。处理单元920的一些示例可以包括但不限于,复杂指令集计算机(CISC)微处理器、精简指令集计算(RISC)微处理器、超长指令字(VLIW)微处理器、实现指令集的组合的处理器、或其它处理器设备。例如,在一实施例中,处理单元920可被实现为通用处理器。或者,处理单元920可被实现为专用处理器,诸如控制器、微控制器、嵌入式处理器、数字信号处理器(DSP)、网络处理器、媒体处理器、输入/输出(I/O)处理器、媒体访问控制(MAC)处理器、无线电基带处理器、现场可编程门阵列(FPGA)、可编程逻辑器件(PLD)、专用集成电路(ASIC)等等。各实施例在此上下文中不受限制。
例如,在一实施例中,计算机910可以包括耦合至处理单元920的一个或多个存储器单元930。存储器单元930可以是被安排成存储信息或数据的任何硬件元素。存储器单元的一些示例可以包括但不限于,随机存取存储器(RAM)、动态RAM(DRAM)、双倍数据速率DRAM(DDRAM)、同步DRAM(SDRAM)、静态RAM(SRAM)、只读存储器(ROM)、可编程ROM(PROM)、可擦除可编程ROM(EPROM)、EEPROM、紧致盘ROM(CD-ROM)、可记录紧致盘(CD-R)、可重写紧致盘(CD-RW)、闪存(例如,或非或与非闪存)、内容可寻址存储器(CAM)、聚合物存储器(例如,铁电聚合物存储器)、相变存储器(例如,奥氏存储器)、铁电存储器、硅-氧化物-氮化物-氧化物-硅(SONOS)存储器、盘(例如,软盘、硬盘、光盘、磁盘、磁光盘)、或卡(例如,磁卡、光卡)、磁带、盒式磁带、或者可用来存储所需信息且计算机910可访问的任何其它介质。各实施例在此上下文中不受限制。
例如,在一实施例中,计算机910可以包括将包括存储器单元930在内的各种系统组件耦合至处理单元920的系统总线921。系统总线921可以是几种类型的总线结构中的任何一种,包括存储器总线或存储器控制器、外围总线、以及使用多种总线体系结构中的任何一种的局部总线。作为示例而非局限,这样的体系结构包括工业标准体系结构(ISA)总线、微通道体系结构(MCA)总线、增强型ISA(EISA)总线、视频电子技术标准协会(VESA)局部总线、外围部件互连(PCI)总线(也称为夹层(Mezzanine)总线)等等。各实施例在此上下文中不受限制。
在各实施例中,计算机910可以包括各种类型的存储介质。存储介质可以表示能存储数据或信息的任何存储介质,诸如易失性或非易失性存储器、可移动或不可移动存储器、可擦除或不可擦除存储器、可写或可重写存储器等等。存储介质可以包括两种通用类型,包括计算机可读介质或通信介质。计算机可读介质可以包括适用于对诸如计算机系统体系结构900等计算机系统读和写的存储介质。用于计算机系统体系结构900的计算机可读介质的示例可以包括但不限于易失性和/或非易失性存储器,如ROM931和RAM 932。通信介质通常以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并包括任意信息传送介质。术语“已调制数据信号”指的是其一个或多个特征以在信号中编码信息的方式被设定或更改的信号。作为示例而非局限,通信介质包括有线介质,如有线网络或直接连线连接,以及无线介质,如声学、射频(RF)谱、红外和其它无线介质。上述中任一组合也应包括在计算机可读介质的范围之内。
在各实施例中,存储器单元930包括易失性和/或非易失性存储器形式的计算机存储介质,如ROM 931和RAM 932。基本输入/输出系统933(BIOS)包含如在启动时帮助在计算机910内的单元之间传输信息的基本例程,它通常储存在ROM 931中。RAM 932通常包含处理单元920可以立即访问和/或目前正在其上操作的数据和/或程序模块。作为示例而非限制,图4示出了操作系统934、应用程序935、其它程序模块936和程序数据937。
计算机910也可以包括其它可移动/不可移动、易失性/非易失性计算机存储介质。仅作为示例,图4示出了从不可移动、非易失性磁介质中读取或向其写入的硬盘驱动器940,从可移动、非易失性磁盘952中读取或向其写入的磁盘驱动器951,以及从诸如CD ROM或其它光学介质等可移动、非易失性光盘956中读取或向其写入的光盘驱动器955。可以在示例性操作环境中使用的其它可移动/不可移动、易失性/非易失性计算机存储介质包括但不限于,磁带盒、闪存卡、数字多功能盘、数字录像带、固态RAM、固态ROM等等。硬盘驱动器941通常由不可移动存储器接口,诸如接口940连接至系统总线921,磁盘驱动器951和光盘驱动器955通常由可移动存储器接口,诸如接口950连接至系统总线921。
上文讨论并在图4中示出的驱动器及其相关联的计算机存储介质为计算机910提供了计算机可读指令、数据结构、程序模块和其它数据的存储。在图4中,例如,硬盘驱动器941被示为存储操作系统944、应用程序945、其它程序模块946和程序数据947。注意,这些组件可以与操作系统934、应用程序935、其它程序模块936和程序数据937相同,也可以与它们不同。操作系统944、应用程序945、其它程序模块946和程序数据947在这里被标注了不同的标号是为了说明至少它们是不同的副本。用户可以通过输入设备,诸如键盘962和定点设备961(通常称为鼠标、跟踪球或触摸垫)向计算机910输入命令和信息。其它输入设备(未示出)可以包括话筒、操纵杆、游戏手柄、圆盘式卫星天线、扫描仪等。这些和其它输入设备通常由耦合至系统总线的用户输入接口960连接至处理单元920,但也可以由其它接口和总线结构,诸如并行端口、游戏端口或通用串行总线(USB)连接。监视器991或其它类型的显示设备也经由接口,诸如视频接口990连接至系统总线921。除监视器991之外,计算机也可包括其它外围输出设备,如扬声器997和打印机996,它们通过输出外围接口990连接。
计算机910可使用至一个或多个远程计算机,如远程计算机980的逻辑连接在网络化环境中操作。远程计算机980可以是个人计算机(PC)、服务器、路由器、网络PC、对等设备或其它常见的网络节点,且通常包括上文相对于计算机910描述的许多或所有元件,尽管在图4中为了清楚起见只示出存储器存储设备981。图4中所示的逻辑连接包括局域网(LAN)97 1和广域网(WAN)973,但也可以包括其它网络。这样的联网环境在办公室、企业范围计算机网络、内联网和因特网中是常见的。
当在LAN联网环境中使用时,计算机910通过网络接口或适配器970连接至LAN 971。当在WAN联网环境中使用时,计算机910通常包括调制解调器972或适用于通过诸如因特网等WAN 973建立通信的其它技术。调制解调器972可以是内置或外置的,它可以经由用户输入接口960或其它适当的机制连接至系统总线921。在网络化环境中,相对于计算机910所描述的程序模块或其部分可被储存在远程存储器存储设备中。作为示例而非限制,图4示出远程应用程序985驻留在存储器设备981上。可以理解,所示的网络连接是示例性的,可以使用在计算机之间建立通信链路的其它技术。此外,网络连接可被实现为有线或无线连接。在后一种情况中,计算系统体系结构900可以用适用于无线通信的各种元素来修改,诸如一个或多个天线、发射机、接收机、收发机、无线电设备、放大器、滤波器、通信接口以及其它无线元件。例如,无线通信系统通过如射频(RF)谱的一个或多个部分或频带等无线通信介质来传送信息和数据。各实施例在此上下文中不受限制。
受管分类系统100和/或计算系统体系结构900的某一些或全部可被实现为电子设备的一个部分、组件或子系统。电子设备的示例可以包括但不限于,处理系统、计算机、服务器、工作站、电器、终端、个人计算机、膝上型计算机、超膝上型计算机、手持式计算机、小型机、大型计算机、分布式计算系统、多处理器系统、基于处理器的系统、消费电子产品、可编程消费电子产品、个人数字助理、电视、数字电视、机顶盒、电话、移动电话、蜂窝电话、手机、无线接入点、基站、用户站、移动用户中心、无线电网络控制器、路由器、集线器、网关、网桥、交换机、机器或其组合。各实施例在此上下文中不受限制。
在某些情况下,各实施例可被实现为制品。制品可以包括被安排成存储用于执行一个或多个实施例的各种操作的逻辑和/或数据的存储介质。存储介质的示例可以包括但不限于先前关于存储器单元130所提供的那些示例。例如,在各实施例中,制品可以包括含有适于由通用处理器或专用处理器来执行的计算机程序指令的磁盘、光盘、闪存或固件。然而,各实施例在此上下文中不受限制。
各实施例可以使用硬件元素、软件元素或两者的组合来实现。硬件元素的示例可以包括如先前关于逻辑设备所提供的任何示例,且还可以包括微处理器、电路、电路元件(例如,晶体管、电阻器、电容器、电感器等等)、集成电路、逻辑门、寄存器、半导体器件、芯片、微芯片、芯片组等等。软件元素的示例可以包括软件组件、程序、应用软件、计算机程序、应用程序、系统程序、机器程序、操作系统软件、中间件、固件、软件模块、例程、子例程、函数、方法、过程、软件接口、应用程序接口(API)、指令集、计算代码、计算机代码、代码段、计算机代码段、文字、值、符号、或其任意组合。确定一实施例是否使用硬件元素和/或软件元素来实现可视给定实现所需根据任何数量的因素而变化,这些因素如所需计算速率、功率级、耐热性、处理周期预算、输入数据速率、输出数据速率、存储器资源、数据总线速度以及其它设计或性能约束。
某些实施例可使用表述“耦合的”和“连接的”及其派生词来描述。这些术语不必旨在互为同义词。例如,某些实施例可使用术语“连接的”和/或“耦合的”来描述以指示两个或更多元素彼此有直接的物理或电接触。然而,术语“耦合的”还可以意味着两个或更多元素彼此不直接接触,而仍彼此合作或交互。
要强调的是,提供了本公开的摘要以符合37 C.F.R。1.72(b)节,该节要求使读者能快速确定本技术公开的特性的摘要。提交摘要的同时要明白其将不用来解释或限制权利要求的范围或含义。另外,在前面的详细描述中,可以看到,出于将本公开连成一个整体的目的而将各种特征组合在一起放在单个实施例中。此公开方法将不被解释为反映所要求保护的实施例要求比每个权利要求中明确陈述的更多特征的意图。相反,如以下权利要求书所反映的,本发明的主题决不在于单个公开实施例的所有特征。从而,据此将所附权利要求结合进详细描述中,其中每个权利要求独立地代表一个单独的实施例。在所附权利要求书中,术语“包括”和“其中”分别用作术语“包含”和“在其中”的易懂的英文等价词。而且,术语“第一”、“第二”、“第三”等等只用作标记,而不旨在将数字要求强加于其对象上。
尽管用对结构特征和/或方法动作专用的语言描述了本主题,但可以理解,所附权利要求书中定义的主题不必限于上述具体特征或动作。相反,上述具体特征和动作是作为实现权利要求的示例形式公开的。

Claims (20)

1.一种方法,包括:
将非正式词汇表检索词指派给受管分类的类别(302);
将判决参数指派给所述非正式词汇表检索词(304);以及
基于所述判决参数将所述非正式词汇表检索词转换为正式词汇表检索词(306)。
2.如权利要求1所述的方法,其特征在于,所述判决参数包括使用参数、加权参数、关系参数、或相关性参数。
3.如权利要求1所述的方法,其特征在于,包括为所述非正式词汇表检索词指派判决参数,所述判决参数包括表示所述非正式词汇表检索词与资源相关联的次数的使用参数。
4.如权利要求1所述的方法,其特征在于,包括为所述非正式词汇表检索词指派判决参数,所述判决参数包括表示所述非正式词汇表检索词或资源的优先级的加权参数。
5.如权利要求1所述的方法,其特征在于,包括为所述非正式词汇表检索词指派判决参数,所述判决参数包括表示所述非正式词汇表检索词与所述受管分类中的正式词汇表检索词之间的关系的关系参数。
6.如权利要求1所述的方法,其特征在于,包括为所述非正式词汇表检索词指派判决参数,所述判决参数包括表示与正式词汇表检索词或资源的相关性级别的相关性参数。
7.如权利要求1所述的方法,其特征在于,包括如果所述判决参数超过定义的阈值就将所述非正式词汇表检索词转换为正式词汇表检索词。
8.如权利要求1所述的方法,其特征在于,包括将所述转换的正式词汇表检索词插入所述受管分类的正式词汇表检索词的分层结构中。
9.一种包括含有指令的存储介质的物品,所述指令如果被执行则可使系统:
将非正式词汇表检索词指派给受管分类的类别;
将判决参数指派给所述非正式词汇表检索词;
监视所述指派的判决参数;以及
基于所述判决参数将所述非正式词汇表检索词转换为正式词汇表检索词。
10.如权利要求9所述的物品,其特征在于,还包括如果被执行则可使所述系统为所述非正式词汇表检索词指派判决参数的指令,所述判决参数包括表示所述非正式词汇表检索词与资源相关联的次数的使用参数。
11.如权利要求9所述的物品,其特征在于,还包括如果被执行则可使所述系统为所述非正式词汇表检索词指派判决参数的指令,所述判决参数包括表示所述非正式词汇表检索词或资源的优先级的加权参数。
12.如权利要求9所述的物品,其特征在于,还包括如果被执行则可使所述系统为所述非正式词汇表检索词指派判决参数的指令,所述判决参数包括表示所述非正式词汇表检索词与所述受管分类中的正式词汇表检索词之间的关系的关系参数。
13.如权利要求9所述的物品,其特征在于,还包括如果被执行则可使所述系统为所述非正式词汇表检索词指派判决参数的指令,所述判决参数包括表示与正式词汇表检索词或资源的相关性级别的相关性参数。
14.如权利要求9所述的物品,其特征在于,还包括如果被执行则可使得所述系统在所述判决参数超过定义的阈值的情况下将所述非正式词汇表检索词转换为正式词汇表检索词的指令。
15.如权利要求9所述的物品,其特征在于,还包括如果被执行则可使所述系统将所述转换的正式词汇表检索词插入到所述受管分类的正式词汇表检索词的分层结构中的指令。
16.一种包括受管分类系统(100)的装置,所述受管分类系统具有管理以分层结构组织的正式词汇表检索词(114)的分类(112)的词汇表管理模块(102),所述分类具有存储为关键字列表(206)的非正式词汇表检索词(116)的类别。
17.如权利要求16所述的装置,其特征在于,包括将判决参数(208)指派给非正式词汇表检索词的词汇表指派模块(104)。
18.如权利要求16所述的装置,其特征在于,包括将非正式词汇表检索词与资源相关联的词汇表关联模块(106)。
19.如权利要求16所述的装置,其特征在于,包括分析非正式词汇表检索词的判决参数,并基于所述判决参数将所述非正式词汇表检索词转换为正式词汇表检索词的词汇表分析模块(108)。
20.如权利要求16所述的装置,其特征在于,包括基于非正式词汇表检索词的使用将所述非正式词汇表检索词转换为正式词汇表检索词的词汇表分析模块(108)。
CN200880004076A 2007-02-06 2008-01-25 管理分类系统的词汇表检索词的技术 Pending CN101636760A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/703,002 2007-02-06
US11/703,002 US20080189265A1 (en) 2007-02-06 2007-02-06 Techniques to manage vocabulary terms for a taxonomy system

Publications (1)

Publication Number Publication Date
CN101636760A true CN101636760A (zh) 2010-01-27

Family

ID=39677020

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880004076A Pending CN101636760A (zh) 2007-02-06 2008-01-25 管理分类系统的词汇表检索词的技术

Country Status (5)

Country Link
US (1) US20080189265A1 (zh)
EP (1) EP2118844A4 (zh)
CN (1) CN101636760A (zh)
TW (1) TW200841199A (zh)
WO (1) WO2008097734A1 (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7536637B1 (en) * 2008-02-07 2009-05-19 International Business Machines Corporation Method and system for the utilization of collaborative and social tagging for adaptation in web portals
US9069848B2 (en) * 2009-09-29 2015-06-30 International Business Machines Corporation Automatic taxonomy enrichment
US9201965B1 (en) 2009-09-30 2015-12-01 Cisco Technology, Inc. System and method for providing speech recognition using personal vocabulary in a network environment
US8935274B1 (en) * 2010-05-12 2015-01-13 Cisco Technology, Inc System and method for deriving user expertise based on data propagating in a network environment
US20110307243A1 (en) * 2010-06-10 2011-12-15 Microsoft Corporation Multilingual runtime rendering of metadata
US9465795B2 (en) 2010-12-17 2016-10-11 Cisco Technology, Inc. System and method for providing feeds based on activity in a network environment
JP5651789B2 (ja) * 2011-02-16 2015-01-14 エンパイア テクノロジー ディベロップメント エルエルシー 意味的に制限された関係を使用したクエリの実行
TWI483138B (zh) 2012-10-12 2015-05-01 Acer Inc 遠端動態資料的處理與驗證方法、系統,以及電腦可讀記錄媒體
US9152705B2 (en) 2012-10-24 2015-10-06 Wal-Mart Stores, Inc. Automatic taxonomy merge
WO2015132886A1 (ja) * 2014-03-04 2015-09-11 楽天株式会社 情報処理装置、情報処理方法、プログラム及び記憶媒体
CA2977847A1 (en) * 2017-01-27 2018-07-27 Hootsuite Media Inc. Automated extraction tools and their use in social content tagging systems
WO2018209086A1 (en) * 2017-05-10 2018-11-15 Agora Intelligence, Inc. d/b/a Crowdz Method, apparatus, and computer-readable medium for generating categorical and criterion-based search results from a search query

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2817776B2 (ja) * 1995-05-25 1998-10-30 日本電気株式会社 単語変換装置
KR100252717B1 (ko) * 1997-11-22 2000-04-15 전주범 지역언어를 표준어로 변환하는 기능을 가진 텔레비전
US6446061B1 (en) * 1998-07-31 2002-09-03 International Business Machines Corporation Taxonomy generation for document collections
US6711585B1 (en) * 1999-06-15 2004-03-23 Kanisa Inc. System and method for implementing a knowledge management system
CA2404337A1 (en) * 2000-03-27 2001-10-04 Documentum, Inc. Method and apparatus for generating metadata for a document
US6704729B1 (en) * 2000-05-19 2004-03-09 Microsoft Corporation Retrieval of relevant information categories
US6647383B1 (en) * 2000-09-01 2003-11-11 Lucent Technologies Inc. System and method for providing interactive dialogue and iterative search functions to find information
US20060064666A1 (en) * 2001-05-25 2006-03-23 Amaru Ruth M Business rules for configurable metamodels and enterprise impact analysis
US7526425B2 (en) * 2001-08-14 2009-04-28 Evri Inc. Method and system for extending keyword searching to syntactically and semantically annotated data
US6947947B2 (en) * 2001-08-17 2005-09-20 Universal Business Matrix Llc Method for adding metadata to data
AUPR958901A0 (en) * 2001-12-18 2002-01-24 Telstra New Wave Pty Ltd Information resource taxonomy
KR20030072837A (ko) * 2002-03-07 2003-09-19 엘지전자 주식회사 이동통신 단말기에서 표준어 변환 처리장치
US7085771B2 (en) * 2002-05-17 2006-08-01 Verity, Inc System and method for automatically discovering a hierarchy of concepts from a corpus of documents
US7668816B2 (en) * 2002-06-11 2010-02-23 Microsoft Corporation Dynamically updated quick searches and strategies
US7076497B2 (en) * 2002-10-11 2006-07-11 Emergency24, Inc. Method for providing and exchanging search terms between internet site promoters
US7047236B2 (en) * 2002-12-31 2006-05-16 International Business Machines Corporation Method for automatic deduction of rules for matching content to categories
US8380715B2 (en) * 2004-06-04 2013-02-19 Vital Source Technologies, Inc. System, method and computer program product for managing and organizing pieces of content
US7584161B2 (en) * 2004-09-15 2009-09-01 Contextware, Inc. Software system for managing information in context
US20060095345A1 (en) * 2004-10-28 2006-05-04 Microsoft Corporation System and method for an online catalog system having integrated search and browse capability
KR20060061604A (ko) * 2004-12-02 2006-06-08 주식회사 팬택 이동 통신 단말기에서의 문자 변환 서비스 제공 방법 및그 장치
US7428533B2 (en) * 2004-12-06 2008-09-23 Yahoo! Inc. Automatic generation of taxonomies for categorizing queries and search query processing using taxonomies
US7620628B2 (en) * 2004-12-06 2009-11-17 Yahoo! Inc. Search processing with automatic categorization of queries
US20070073745A1 (en) * 2005-09-23 2007-03-29 Applied Linguistics, Llc Similarity metric for semantic profiling
US8255383B2 (en) * 2006-07-14 2012-08-28 Chacha Search, Inc Method and system for qualifying keywords in query strings
US7792967B2 (en) * 2006-07-14 2010-09-07 Chacha Search, Inc. Method and system for sharing and accessing resources
US8156154B2 (en) * 2007-02-05 2012-04-10 Microsoft Corporation Techniques to manage a taxonomy system for heterogeneous resource domain

Also Published As

Publication number Publication date
WO2008097734A1 (en) 2008-08-14
TW200841199A (en) 2008-10-16
US20080189265A1 (en) 2008-08-07
EP2118844A4 (en) 2011-09-07
EP2118844A1 (en) 2009-11-18

Similar Documents

Publication Publication Date Title
CN101606174B (zh) 管理针对异构资源域的分类系统的技术
CN101636760A (zh) 管理分类系统的词汇表检索词的技术
Figuerola et al. Mapping the evolution of library and information science (1978–2014) using topic modeling on LISA
Berlingerio et al. Abacus: frequent pattern mining-based community discovery in multidimensional networks
JP4750456B2 (ja) エンハンストドキュメント取り出しのためのコンテンツ伝播
Zhou et al. An unsupervised model for exploring hierarchical semantics from social annotations
US20030033288A1 (en) Document-centric system with auto-completion and auto-correction
KR20090010185A (ko) 싱글 및 멀티플 택소노미 관리 방법 및 시스템
Lee et al. A social inverted index for social-tagging-based information retrieval
CN115168401A (zh) 数据分级处理方法及装置、电子设备及计算机可读介质
Das et al. Case study of trend mining in Transportation Research Record articles
Khan et al. Key features of digital library management system (DLMS) for developing digital libraries: An investigation from LIS practitioners in Pakistan
Wong et al. An unsupervised method for joint information extraction and feature mining across different web sites
Cui et al. Improving image annotation via ranking‐oriented neighbor search and learning‐based keyword propagation
Kasemsap Mastering big data in the digital age
McGrath Musings on Faceted Search, Metadata, and Library Discovery Interfaces
Natu et al. Digital asset management using a native XML database implementation
Varma Use of ontologies for organizational knowledge management and knowledge management systems
US12112365B2 (en) Probabilistic determination of compatible content
Hong et al. Semantic tag recommendation based on associated words exploiting the interwiki links of Wikipedia
Ruiz-Martínez et al. An ontological model for managing professional expertise
US12020297B1 (en) Relevance-based schema matching for targeted catalog enrichment
US11449516B2 (en) Ranking of documents belonging to different domains based on comparison of descriptors thereof
Nassis et al. A requirement engineering approach for designing XML-view driven, XML document warehouses
Jang et al. A stream-based method to detect differences between XML documents

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20100127