CN102216928A - 用于检索数据并显示数据存储器的内容密度的方法和系统 - Google Patents

用于检索数据并显示数据存储器的内容密度的方法和系统 Download PDF

Info

Publication number
CN102216928A
CN102216928A CN2009801452836A CN200980145283A CN102216928A CN 102216928 A CN102216928 A CN 102216928A CN 2009801452836 A CN2009801452836 A CN 2009801452836A CN 200980145283 A CN200980145283 A CN 200980145283A CN 102216928 A CN102216928 A CN 102216928A
Authority
CN
China
Prior art keywords
record
data
query result
label
carrier store
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009801452836A
Other languages
English (en)
Other versions
CN102216928B (zh
Inventor
艾哈迈德·法拉尔埃姆
陈耀生
菲斯耶·穆罕默德·努尔
佩鲁马尔·纳根德拉恩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mimos Bhd
Original Assignee
Mimos Bhd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mimos Bhd filed Critical Mimos Bhd
Publication of CN102216928A publication Critical patent/CN102216928A/zh
Application granted granted Critical
Publication of CN102216928B publication Critical patent/CN102216928B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种用于检索数据并显示数据存储器的内容密度的方法和系统。本发明的数据检索系统实质上包括查询界面、数据存储、数据检索组件、检索数据处理组件、以及显示单元。数据检索系统进一步包括数据查询及组织组件。实质上,数据查询及组织组件包括第一查询部件、第二查询部件、以及分配部件。第一查询部件适于执行第一查询,以基于查询的内容条目的至少一部分从数据存储器中检索数据,以及第二查询部件适于执行第二查询,以基于查询的不同的内容条目的至少一部分从数据存储器中检索不同的数据。分配部件适于将第一查询结果的记录和第二查询结果的记录进行比较,以获取落入第一查询结果的所有记录中的第二查询结果的各记录的出现次数;根据获取的出现频率向第二查询结果的各记录分配频率权重,以及根据第二查询结果的对应记录的频率权重,向第二查询结果的各记录分配预先确定的格式类型。根据分配的格式类型,通过显示单元使第二查询结果的记录以表征显示。因此,可以描绘数据存储器中第二查询结果的对应记录的内容密度。本发明的方法主要包括查询数据存储器、从数据存储器中检索数据、处理检索到的数据、以及显示检索到的数据的步骤。

Description

用于检索数据并显示数据存储器的内容密度的方法和系统
技术领域
本发明涉及一种用以表现从数据存储器中查询的内容的方法和系统。
背景技术
已提供了很多系统或基于网络的应用,其目的在于在从知识库或数据存储器中进行查询时,以这样的方式检索数据并显示内容,使得用户可以选择标签以浏览关于查询内容的更多具体信息。
然而,这些系统或应用并不能显示内容的密度(intensity),对于用户,该内容是可从数据存储器中获得的。特别是对于读写工具,对于用户来说,有必要在看一眼后就知道能够从数据存储器/知识库中获得多少数据。常规的系统或应用程序以这样的格式表现其知识库中的内容,该格式使得不能向用户提供很多信息以帮助他们全面地浏览信息。
使用上述系统或应用的用户需要知道可以在数据存储器中获得多少查询的内容,以能够有成效地进行内容的查询。然而,大多数系统或应用程序仅表现从计算装置收到的在答复请求时推荐的标签和/或内容条目。用户对于生成的标签或内容条目可能并不感兴趣。而且,在推荐的标签可能以列表形式生成的情况下,用户对于知道在数据存储器中有多少信息可通过查询获得更感兴趣。内容条目可基于对标签与内容条目相关联的次数的测量而获得。这样的系统或应用程序在查询时仅使用推荐引擎运行并检索数据存储器中的数据。
以从数据存储器中检索并表现数据的系统为主题,例如,英国专利No.2368249描述了一种数据处理装置,其可以接收来自具有预设符号组的源的符号,并能够产生组中各符号的相对出现频率的权重指示。该发明所披露的数据处理装置包括:数据缓冲器,向其输入接收的数据符号;数据存储器,设置成存储代表各个可能的数据符号的频率分数的数据;以及控制处理机,其设置成在操作中偏向来自检索组的各源数据符号的频率计分,以基于各数据符号在缓冲器内的相对位置所确定的数量,对缓冲器内的至少一个数据符号调整频率分数,并且基于相应的频率分数产生用于各可能的数据符号权重。数据处理装置也包括压缩编码器和/或解压缩器,压缩编码器能够基于产生的该符号的权重来对数据符号进行编码。
上述识别系统利用从源接收的组中的各符号的相对出现频率的指示产生的权重。重要的是,基于所查询数据在知识库中的频率权重,该系统或应用程序能够获得来自数据存储器的内容条目。然而,该系统或应用程序限于仅根据出现频率突出检索的数据,但不能同时突出知识库中数据的内容密度。
因此,需要提供一种系统或应用程序,其不仅能够设计为基于知识库中所查询的内容的频率权重突出检索到的数据,而且能够突出知识库中的内容密度,以便于用户的查询。
发明内容
因此,本发明涉及一种用于检索数据并显示数据存储器的内容密度的方法和系统。在一方面中,用于从数据存储器中检索数据并显示数据存储器的内容密度的方法实质上包括下述步骤:查询数据存储器、从数据存储器中检索数据、处理检索到的数据、以及显示检索到的数据。
从数据存储器中检索数据的步骤包括以下步骤:执行第一查询以从数据存储器中检索数据,以及执行第二查询,以从数据存储器中检索不同的数据。所述第一查询基于查询的内容条目的至少一部分进行,以及所述第二查询基于查询的不同的内容条目的至少一部分。
实质上,处理检索到的数据的步骤包括以下步骤:将第一查询的结果的记录与第二查询的结果的记录进行比较;获取落入第一查询结果的所有记录中的第二查询结果的各记录的出现次数,以确定第二查询结果的各记录的出现频率,基于所述获取的出现频率向第二查询结果的各记录分配频率权重,以及,向第二查询结果的各记录分配预先确定的格式类型,所述格式类型基于第二查询结果的对应记录的所述频率权重。
最后,显示检索到的数据的步骤包括以下步骤:以描绘数据存储器中第二查询结果的对应记录的内容密度的方式,根据表征中的对应的格式类型来显示第二查询结果的各记录。
在另一方面中,实质上,数据检索系统包括查询界面、数据存储器、数据检索组件、检索数据处理组件、以及显示单元。数据检索系统进一步包括数据查询及组织组件。数据查询及组织组件包括第一查询部件、第二查询部件、以及分配部件。
第一查询部件实质上适于执行第一查询,以基于查询的内容条目的至少一部分从数据存储器中检索数据。第二查询部件适于执行第二查询,以基于查询的不同的内容条目的至少一部分从数据存储器检索不同的数据。分配部件合宜地构造成将第一查询的结果的记录和第二查询的结果的记录进行比较,以获取落入第一查询结果的所有记录中的第二查询结果的各记录的出现次数,根据获取的出现频率向第二查询结果的各记录分配频率权重,以及最后根据第二查询结果的对应记录的频率权重,向第二查询结果的各记录分配预先确定的格式类型。
根据分配的格式类型,通过显示单元使第二查询结果的记录相继地以表征显示,使得可以描绘数据存储器中第二查询结果的对应记录的内容密度。
本发明的目的之一是便于用户识别数据存储器中存在多少用于查询的数据或信息。
本发明的又一目的是清晰地呈现从数据存储器获取的记录的内容的大/小。这样便于用户参照对应的标签字体大小或标签云来识别查询时标签是否具有较多内容或较少内容。
本发明的另一目的是以带有分配给标签的预定的格式类型的标签云的形式表示数据存储器中的内容密度。以数据存储器中的内容密度能够易于识别的方式,内容密度表示法实现了数据存储器的内容的可视化。
本发明的最后一个目的是,根据落入第一查询的第二查询的出现频率,以使得标签能够指示标签的内容密度并能够以标签云的形式显示结果的方式,将格式类型分配给标签云、标签字体尺寸或与标签相关的其他事物。
本发明包括特定的新颖性特征以及部件的组合,下文将详细描述并结合附图进行图示,并且在所附权利要求中特别指出;可以理解,在不背离本发明范围或牺牲本发明的任何优点的基础上,可对其进行多种变化。
附图说明
为了便于理解本发明,附图中示出优选实施例,结合下列说明,本发明、其结构、操作及很多优点将易于理解。
图1为示出在生成标签云的过程中涉及的阶段的流程图;
图2为示出形成标签云的核心过程的流程图;
图3为示出产生标签云的整个过程的流程图。
具体实现方式
本发明涉及一种从数据存储器中查询内容的方法和系统。更具体地,本发明涉及一种用于检索数据和显示数据存储器的内容密度的方法和系统。下文将根据本发明的优选实施例及参照所附说明和附图对所述方法和系统进行说明。但是,可以理解,对本发明优选实施例和附图的说明仅限于讨论本发明,可以预见在不偏离所附权利要求的范围的基础上,本领域技术人员可以进行各种变化。
参照图1,下文披露了一种适于从数据存储器中检索数据并显示数据存储器中的内容密度的方法和系统。一般来说,需要表示知识库10中的内容,以使用户能够广泛地浏览信息。常规系统或基于网络的应用程序不能向用户表示能够从知识库10中获得的内容密集度。特别对于读写工具,对于用户尤其是学生来说,有必要在看一眼后就知道能够从知识库10中获得多少数据。
本发明能够消除上述缺陷。用户便于区分在知识库10内哪些内容丰富以及哪些内容缺乏。此外,也便于用户在看一眼后容易了解知识库10中的哪个标签具有较高的内容相关度以及哪个标签具有较低的内容相关度。因此,本发明提供了这样一种解决方案,由此,知识库10中的查询内容以标签云20的形式呈现。用户能够发现知识库10中有多少内容与特定内容条目相关联。
标签云20通常为能够从知识库10中可获得的可视化(加权列表)表示pf信息。标签云20通常通过获取出现频率并且随后向结果中的记录分配频率权重(weight)而产生。可以理解本发明的正常实施例为实现标签的不同字体尺寸或标签云的不同尺寸。作为示例,如果标签字体尺寸较小,这表示关于该特定标签的信息非常少,以及,如果标签字体尺寸较大,说明关于该特定标签的信息很多。
一方面,该方法在包括数据存储器的数据检索系统中执行。该方法一般包括下列步骤:查询数据存储器、从数据存储器中检索数据、处理检索到的数据、以及显示检索到的数据。本发明中非常优选的是,知识库10可作为数据存储器。
参照图1和图3,在从知识库中检索数据的步骤中,优选地,执行第一查询,以基于查询的内容条目从知识库10中检索数据。然后,执行第二查询,以基于查询的不同的(distinct)内容条目从知识库10中检索不同的数据。
在第一查询中,从知识库10检索各自包括主语、谓语和宾语的所有数据。在第二查询中,从知识库10检索包括主语和描述文本或标记(label)的不同的数据。根据优选的实施例,第一查询和第二查询适于对应地相继地执行或同时执行。
然后,获取进入第一查询结果的所有记录中的第二查询结果的各记录的出现的次数,以确定第二查询结果的各记录的出现频率。现在参照图2,其示出本发明采用的一个方法,以将第二查询结果与第一查询的第一结果进行比较。对于第二查询的结果的每个特定记录(主语),将其与第一查询的结果进行比较,以计算第一查询结果中的第二查询结果的每个特定记录(主语)的出现次数的总和。在第一查询结果和第二查询结果的记录的比较中,第二查询结果的各记录将与第一查询结果的各记录匹配,以基于匹配结果计算出现次数。可以理解,如果二者的对应记录不匹配,那么第二查询结果的各记录的标记将用数字“0”来映射;或如果二者对应记录彼此匹配,那么将获得匹配的记录的次数,然后,第二查询结果的各记录的标记将用先前获得的匹配记录的次数映射,以及,最后对照标记映射频率统计。
然后,本发明的方法将进行至基于所获取的出现频率向第二查询结果的各记录分配频率权重的步骤。基于第二查询结果的各记录的出现次数,计算出的权重(出现次数)将被分配至第二查询结果的各记录。此外,优选地,基于所述记录的描述文本或标记,将第二查询结果的所有记录进行分类。描述文本或标记也适合作为表示第二查询结果的相应记录的标签。
基于出现次数或频率权重,将格式类型分配至第二查询结果的各记录的文本/标签。格式类型可以体现在标签字体尺寸或标签云的尺寸上;或者,同时体现在二者上。同样优选地,格式类型可体现在用于表示知识库10中的查询内容的内容密度的表征(representation)中显示的任何其他元素上。
优选地,将预先确定的格式类型分配至描述文本或标签,使得能够基于第二查询结果的记录的频率来实现标签的字体尺寸。实质上,标签字体尺寸适于与知识库10中的第二查询结果的记录的内容密度对应。优选地,作为格式类型的结果,对应标签的相对较大的标签字体尺寸,指示知识库10中所述标签的第二查询结果的记录的内容密度较高。对应标签的相对较小的标签字体尺寸,指示知识库10中所述标签的第二查询结果的记录的内容密度较低。
如上所述,根据优选实施例,在第二查询结果的各记录的标签云20上也实现预先确定的格式类型。结果,根据分配至第二查询结果的各记录的格式类型,显示采用标签云20形式的第二查询的记录。实质上,标签云20各自表示第二查询结果的每个记录。同样必要的是,基于各自对应记录的频率,预先确定的格式类型分配至第二查询结果的各记录的标签云。然后,格式类型将便于描绘随后显示的第二查询结果的对应记录的内容密度。同样地,标签云20的尺寸适于对应地指示知识库10中的第二查询结果的记录的内容密度。优选地,该方法构造成指示:标签云20的相对较大尺寸表示知识库10中第二查询结果的记录的较高的内容密度;以及标签云20的相对较小尺寸表示知识库10中第二查询结果的记录的较低的内容密度。
随后,可以理解,本发明的方法进行至显示检索到的数据的步骤。根据表征中的对应格式类型来显示第二查询结果的各个记录。执行该步骤基本上用以描绘知识库10中的第二查询结果的对应记录的内容密度。同样优选地,用HTML元素产生标签云。优选地,使用本体数据库(ontology database)以标签云20的形式产生和显示第二查询的记录。
另一方面,披露了数据检索系统包括查询界面、数据存储器、数据检索组件、检索数据处理组件、以及显示单元。在本发明的数据检索系统中,优选地,知识库10适合作为数据存储器。本发明中的数据检索系统适于进一步包括数据查询及组织组件。
优选地,数据查询及组织组件包括第一查询部件、第二查询部件、以及分配部件。第一查询部件实质上适于执行第一查询,以基于查询的内容条目从知识库10中检索数据(主语、谓语、宾语)。第二查询部件实质上适于执行第二查询,以基于查询的不同的内容条目从知识库10中检索不同的数据(主语、描述文本/标签)。
优选地,分配部件适于将第一查询结果的记录与第二查询结果的记录进行比较,以获取落入第一查询结果的所有记录的第二查询结果的各个记录的出现频率;根据获取的出现频率向第二查询结果的各个记录分配频率权重;以及最后根据第二查询结果的对应记录的频率权重向第二查询结果的各个记录分配预先确定的格式类型。根据分配的格式类型,第二查询结果的记录通过显示单元以表征显示,以描绘知识库10中第二查询结果的对应记录的内容密度。
再次参照图2,进入第一查询结果的所有记录的第二查询结果的各个记录的出现频率将基于两种查询记录的比较结果进行计算。在两种查询结果的记录的比较中,第二查询结果的每个记录(主语)与第一查询结果的各记录相匹配。优选地,如果两个对应记录不匹配,那么第二查询结果的各记录的标记用数字“0”映射;或者,如果两个对应记录彼此匹配,将获取匹配的记录的数量,然后第二查询结果的各记录的标记用先前获取的匹配的记录的数量来映射,以及最后对照标记映射频率统计。
在本发明中,非常优选地,描述文本或标记适合作为表示第二查询结果的对应记录的标签。随后,基于各自对应记录的频率,将预先确定的格式类型分配给第二查询结果的各记录的描述文本或标记。因此,第二查询结果的对应记录的内容密度能够以表征描绘。此外,基于所述记录的描述文本或标签对第二查询结果的所有记录进行存储。
当获得第二查询结果的对应记录的出现次数时,将从其获得出现频率,并将对应频率权重分配至第二查询结果的所述对应记录。
接着,优选地,采用预先确定的格式类型的描述文本或标记根据第二查询结果的记录的频率表现标签的字体尺寸。标签字体尺寸实质上适于对应于知识库10中的第二查询结果的记录的内容密度。对应标签的相对较大的标签字体尺寸适于对应地指示知识库10中所述标签的第二查询结果的记录的较高的内容密度,而对应标签的相对较小的标签字体尺寸适于对应地指示知识库10中所述标签的第二查询结果的记录的较低的内容密度。
也可以理解,根据分配至第二查询结果的各记录的格式类型,以标签云20的形式显示第二查询的记录。本发明适于各个标签云20代表第二查询结果的各个记录。除了标签字体尺寸以外,根据所确定的第二查询结果的各个对应记录的频率,实质上,对于预先确定的格式类型也分配至第二查询结果的各记录的标签云。
将预先确定的格式类型分配至第二查询结果的对应记录来表现标签云20的尺寸,使得知识库10中第二查询结果的记录的内容密度可以由标签云20的尺寸所表示。优选地,本发明适于使标签云20的相对较大尺寸指示知识库10中第二查询结果的记录的相对较高的内容密度,而标签云20的相对较小尺寸指示知识库10中第二查询结果的记录的相对较低的内容密度。
再次参照图3,优选地产生许多预先确定的格式类型。各预先确定的格式类型将满足出现次数的预先确定的范围,第二查询结果的记录能够落入该范围。因此,基于所述特定记录落入的出现次数的范围,第二查询结果的特定记录将采用合适的预先确定的格式类型。
优选地,基于预先确定的格式类型,存在许多目录用来显示标签云中的标签。可以理解,标签按下列格式:
a)最小标签(≥a&<b出现率)
b)小标签(≥b&<c出现率)
c)中等标签(≥c&<d出现率)
d)大标签(≥d&<e出现率)
e)最大标签(≥e出现率)
此处,a、b、c、d、e为根据本发明优选实施例预先确定的格式范围。
根据第二查询结果的各记录的出现次数,标签云根据对于各范围预先确定的格式类型来显示第二查询结果的各记录的标签(描述文本/标记)。上述列出的标签的出现次数的范围以递增顺序设置。然而,根据本发明的最优选的实施例,目录的数量可以减少或扩展。
虽然本发明的上述说明是根据本发明的一些优选的实施例来描述的,所述很多细节仅为了示例目的,对于本领域技术人员,只要不背离本发明的基本思想,很明显本发明还可有其他实施例,并且可以很大程度地改变此处所述细节。

Claims (32)

1.一种用于从数据存储器中检索数据并显示所述数据存储器的内容密度的方法,该方法在数据检索系统内执行,该方法包括以下步骤:查询所述数据存储器;从所述数据存储器中检索数据;处理检索到的数据;以及显示检索到的数据,其特征在于,从所述数据存储器中检索数据的步骤包括以下步骤:
-执行第一查询,以从所述数据存储器中检索数据,基于查询的内容条目的至少一部分进行所述第一查询;以及
-执行第二查询,以从所述数据存储器中检索不同的数据,所述第二查询基于查询的不同的内容条目的至少一部分;
所述处理检索到的数据的步骤包括以下步骤:
-将所述第一查询的结果的记录与所述第二查询的结果的记录进行比较;
-获取落入所述第一查询结果的所有记录中的所述第二查询结果的各个记录的出现次数,以确定所述第二查询结果的各个记录的出现频率;
-基于所述获取的出现频率向所述第二查询结果的各个记录分配频率权重;以及
-向所述第二查询结果的各个记录分配预先确定的格式类型,所述格式类型基于所述第二查询结果的对应记录的所述频率权重;
以及,所述显示检索到的数据的步骤包括以下步骤:
-根据表征中的对应的格式类型,以描绘所述数据存储器中的所述第二查询结果的对应记录的内容密度的方式,显示所述第二查询结果的各个记录。
2.根据权利要求1所述的用于从数据存储器中检索数据并显示数据存储器的内容密度的方法,其特征在于,知识库(10)适合作为所述数据检索系统的所述数据存储器。
3.根据权利要求2所述的用于从数据存储器中检索数据并显示数据存储器的内容密度的方法,其特征在于,所述第一查询的内容条目分别包括从查询内容中识别的主语、谓语和宾语。
4.根据权利要求2所述的用于从数据存储器中检索数据并显示数据存储器的内容密度的方法,其特征在于,所述第二查询的不同的内容条目分别包括主语和至少一个描述文本或标记。
5.根据权利要求1所述的用于从数据存储器中检索数据并显示数据存储器的内容密度的方法,其特征在于,所述描述文本或标记适于作为用于表示所述第二查询结果的对应记录的标签。
6.根据权利要求1所述的用于从数据存储器中检索数据并显示数据存储器的内容密度的方法,其特征在于,向所述第二查询结果的各个记录分配预先确定的格式类型的步骤进一步包括这样的步骤:基于各自的对应记录的频率向所述第二查询结果的各个记录的描述文本或标记分配预先确定的格式类型,以便于以表征方式描绘所述第二查询结果的对应记录的内容密度。
7.根据权利要求6所述的用于从数据存储器中检索数据并显示数据存储器的内容密度的方法,其特征在于,基于所述记录的描述文本或标记对所述第二查询结果的所有记录进行分类。
8.根据权利要求7所述的用于从数据存储器中检索数据并显示数据存储器的内容密度的方法,其特征在于,将预先确定的格式类型分配给所述描述文本或标记,以基于所述第二查询结果的记录的频率实现标签的字体尺寸,使得标签字体尺寸适于对应于所述知识库(10)中的所述第二查询结果的记录的内容密度。
9.根据权利要求8所述的用于从数据存储器中检索数据并显示数据存储器的内容密度的方法,其特征在于,对应标签的相对较大的标签字体尺寸相应地指示所述知识库(10)中所述标签的第二查询结果的记录的较高的内容密度,而对应标签的相对较小的标签字体尺寸相应地指示所述知识库(10)中所述标签的第二查询结果的记录的较低的内容密度。
10.根据权利要求5所述的用于从数据存储器中检索数据并显示数据存储器的内容密度的方法,其中,显示所述第二查询的各个记录的步骤包括根据分配给所述第二查询结果的各个记录的格式类型以多个标签云(20)的形式显示第二查询的记录的步骤,其特征在于,所述标签云(20)分别代表所述第二查询结果的各个记录。
11.根据权利要求10所述的用于从数据存储器中检索数据并显示数据存储器的内容密度的方法,其特征在于,向所述第二查询结果的各个记录分配预先确定的格式类型的步骤进一步包括:基于各自的对应记录的频率向所述第二查询结果的各个记录的标签云(20)分配预先确定的格式类型,以便于以表征方式描绘所述第二查询结果的对应记录的内容密度。
12.根据权利要求11所述的用于从数据存储器中检索数据并显示数据存储器的内容密度的方法,其特征在于,所述标签云(20)的尺寸指示所述知识库(10)中第二查询结果的记录的内容密度。
13.根据权利要求12所述的用于从数据存储器中检索数据并显示数据存储器的内容密度的方法,其中,所述标签云(20)的相对较大尺寸对应地指示所述知识库(10)中第二查询结果的记录的较高的内容密度,而所述标签云(20)的相对较小尺寸对应地指示所述知识库(10)中第二查询结果的记录的较低的内容密度。
14.根据权利要求12所述的用于从数据存储器中检索数据并显示数据存储器的内容密度的方法,其特征在于,使用HTML元素生成所述标签云。
15.根据权利要求12所述的用于从数据存储器中检索数据并显示数据存储器的内容密度的方法,其特征在于,使用本体数据库以标签云(20)的形式生成并显示所述第二查询的记录。
16.根据权利要求1所述的用于从数据存储器中检索数据并显示数据存储器的内容密度的方法,其特征在于,将所述第一查询的结果的记录和所述第二查询的结果的记录进行比较的步骤包括:将所述第二查询结果的各个记录与所述第一查询结果的各个记录进行匹配的步骤。
17.根据权利要求16所述的用于从数据存储器中检索数据并显示数据存储器的内容密度的方法,其特征在于,如果二者对应记录不匹配,则所述第二查询结果的各个记录的标记用数字“0”映射;或者,如果二者对应记录彼此匹配,则获取匹配的记录的数量,然后所述第二查询结果的各个记录的标记用先前获取的匹配的记录的数量映射,以及,最后对照标记映射频率统计。
18.根据权利要求1所述的用于从数据存储器中检索数据并显示数据存储器的内容密度的方法,其中,生成多个预先确定的格式类型,其特征在于:格式类型各个对应于出现次数的预先确定的范围;以及,根据特定记录落入的出现次数的范围,向所述第二查询结果的特定记录分配合适的预先确定的格式类型。
19.一种数据检索系统,其包括:查询界面、数据存储器、数据检索组件、检索数据处理组件、以及显示单元,其特征在于,所述数据检索系统进一步包括数据查询及组织组件,所述数据查询及组织组件包括:
第一查询部件,适于执行第一查询,以基于查询的内容条目的至少一部分从所述数据存储器中检索数据;
第二查询部件,适于执行第二查询,以基于查询的不同的内容条目的至少一部分从所述数据存储器中检索不同的数据;
分配部件,适于将第一查询的结果的记录和第二查询的结果的记录进行比较;以获取落入第一查询结果的所有记录中的第二查询结果的各个记录的出现频率;根据获取的出现频率向所述第二查询结果的各个记录分配频率权重;以及根据所述第二查询结果的对应记录的频率权重,向所述第二查询结果的各个记录分配预先确定的格式类型,其中根据分配的格式类型,通过所述显示单元使所述第二查询结果的记录以表征显示,以描绘所述数据存储器中所述第二查询结果的对应记录的内容密度。
20.根据权利要求19所述的数据检索系统,其特征在于,所述数据存储器为知识库(10)。
21.根据权利要求19所述的数据检索系统,其特征在于,所述第一查询中的内容条目分别包括主语、谓语和宾语。
22.根据权利要求19所述的数据检索系统,其特征在于,所述第二查询的不同的内容条目分别包括主语和描述文本或标记。
23.根据权利要求19所述的数据检索系统,其特征在于,所述描述文本或标记适合作为用于表示所述第二查询结果的对应记录的标签。
24.根据权利要求19所述的数据检索系统,其特征在于,基于各自的对应记录的频率,向所述第二查询结果的各个记录的描述文本或标记分配预先确定的格式类型,以便于以表征方式描绘所述第二查询结果的对应记录的内容密度,以及基于所述记录的描述文本或标记对所述第二查询结果的所有记录进行分类。
25.根据权利要求24所述的数据检索系统,其特征在于,所述描述文本或标记采用预先确定的格式类型,以根据所述第二查询结果的记录的频率实现标签的字体尺寸,使得标签字体尺寸适于对应于所述知识库(10)中的第二查询结果的记录的内容密度。
26.根据权利要求25所述的数据检索系统,其特征在于,对应标签的相对较大的标签字体尺寸对应地指示所述知识库(10)中所述标签的第二查询结果的记录的较高的内容密度,而对应标签的相对较小的标签字体尺寸对应地指示所述知识库(10)中所述标签的第二查询结果的记录的较低的内容密度。
27.根据权利要求19所述的数据检索系统,其中,根据分配至所述第二查询结果的各个记录的格式类型,以多个标签云(20)的形式显示第二查询的记录,其特征在于,所述标签云(20)各个代表所述第二查询结果的各个记录。
28.根据权利要求27所述的数据检索系统,其特征在于,根据采用所述表征所述第二查询结果的各自的对应记录的确定的频率,向所述第二查询结果的各个记录的标签云分配预先确定的格式类型。
29.根据权利要求28所述的数据检索系统,其特征在于,所述标签云(20)的尺寸指示所述知识库(10)中所述第二查询结果的记录的内容密度。
30.根据权利要求29所述的数据检索系统,其特征在于,所述标签云(20)的相对较大尺寸对应地指示所述知识库(10)中第二查询结果的记录的较高的内容密度,而所述标签云(20)的相对较小尺寸对应地指示所述知识库(10)中第二查询结果的记录的较低的内容密度。
31.根据权利要求19所述的数据检索系统,其中,在将所述第一查询结果的记录与所述第二查询结果的记录进行比较的阶段,所述第二查询结果的各个记录与所述第一查询结果的各个记录相匹配,其特征在于,如果二者对应记录不匹配,则所述第二查询结果的各个记录的标记用数字“0”映射;或者,如果二者对应记录彼此匹配,则获取匹配的记录的数量,然后所述第二查询结果的各个记录的标记用先前获取的匹配的记录的数量映射,以及,最后对照标记映射频率统计。
32.根据权利要求19所述的数据检索系统,其中,生成多个预先确定的格式类型,其特征在于,所述格式类型各个对应于出现次数的预先确定的范围;以及,根据特定记录落入的出现次数的范围,向所述第二查询结果的特定记录分配合适的预先确定的格式类型。
CN200980145283.6A 2008-09-12 2009-09-11 用于检索数据并显示数据存储器的内容密度的方法和系统 Expired - Fee Related CN102216928B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
MYPI20083549 MY151173A (en) 2008-09-12 2008-09-12 Method and system for retrieving data and displaying content density of a data storage
MYPI20083549 2008-09-12
PCT/MY2009/000144 WO2010030168A2 (en) 2008-09-12 2009-09-11 Method and system for retrieving data and displaying content density of a data storage

Publications (2)

Publication Number Publication Date
CN102216928A true CN102216928A (zh) 2011-10-12
CN102216928B CN102216928B (zh) 2014-04-30

Family

ID=42005661

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980145283.6A Expired - Fee Related CN102216928B (zh) 2008-09-12 2009-09-11 用于检索数据并显示数据存储器的内容密度的方法和系统

Country Status (5)

Country Link
US (1) US20220067039A1 (zh)
EP (1) EP2327033A4 (zh)
CN (1) CN102216928B (zh)
MY (1) MY151173A (zh)
WO (1) WO2010030168A2 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462132A (zh) * 2013-09-23 2015-03-25 华为技术有限公司 评论信息的显示方法及装置
CN106126711A (zh) * 2016-06-30 2016-11-16 北京奇虎科技有限公司 百科词条分类方法及装置
CN107992622A (zh) * 2017-12-22 2018-05-04 新奥(中国)燃气投资有限公司 一种资讯信息的展示方法和装置
CN109254973A (zh) * 2018-08-29 2019-01-22 北京百度网讯科技有限公司 用于更新信息的方法及装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8478766B1 (en) * 2011-02-02 2013-07-02 Comindware Ltd. Unified data architecture for business process management

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6167398A (en) * 1997-01-30 2000-12-26 British Telecommunications Public Limited Company Information retrieval system and method that generates weighted comparison results to analyze the degree of dissimilarity between a reference corpus and a candidate document
US20050289100A1 (en) * 2004-06-25 2005-12-29 International Business Machines Corporation Techniques for representing relationships between queries
CN101075251A (zh) * 2007-06-18 2007-11-21 中国电子科技集团公司第五十四研究所 一种基于数据挖掘的文本搜索方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2368249A (en) 2000-10-20 2002-04-24 Sony Uk Ltd Generating a weighted frequency of occurence value to enable data compression
US20070038603A1 (en) * 2005-08-10 2007-02-15 Guha Ramanathan V Sharing context data across programmable search engines
US7558787B2 (en) * 2006-07-05 2009-07-07 Yahoo! Inc. Automatic relevance and variety checking for web and vertical search engines
US7630978B2 (en) 2006-12-14 2009-12-08 Yahoo! Inc. Query rewriting with spell correction suggestions using a generated set of query features

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6167398A (en) * 1997-01-30 2000-12-26 British Telecommunications Public Limited Company Information retrieval system and method that generates weighted comparison results to analyze the degree of dissimilarity between a reference corpus and a candidate document
US20050289100A1 (en) * 2004-06-25 2005-12-29 International Business Machines Corporation Techniques for representing relationships between queries
CN101075251A (zh) * 2007-06-18 2007-11-21 中国电子科技集团公司第五十四研究所 一种基于数据挖掘的文本搜索方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462132A (zh) * 2013-09-23 2015-03-25 华为技术有限公司 评论信息的显示方法及装置
CN106126711A (zh) * 2016-06-30 2016-11-16 北京奇虎科技有限公司 百科词条分类方法及装置
CN107992622A (zh) * 2017-12-22 2018-05-04 新奥(中国)燃气投资有限公司 一种资讯信息的展示方法和装置
CN107992622B (zh) * 2017-12-22 2021-10-15 新奥(中国)燃气投资有限公司 一种资讯信息的展示方法和装置
CN109254973A (zh) * 2018-08-29 2019-01-22 北京百度网讯科技有限公司 用于更新信息的方法及装置
US11436409B2 (en) 2018-08-29 2022-09-06 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for updating subject name information of a target information source

Also Published As

Publication number Publication date
MY151173A (en) 2014-04-30
WO2010030168A3 (en) 2010-07-01
CN102216928B (zh) 2014-04-30
EP2327033A4 (en) 2014-02-26
US20220067039A1 (en) 2022-03-03
WO2010030168A2 (en) 2010-03-18
EP2327033A2 (en) 2011-06-01

Similar Documents

Publication Publication Date Title
US8190556B2 (en) Intellegent data search engine
US8266019B2 (en) Optimizing retrieval of object-associated information
US9390301B2 (en) User grouping apparatus and methods based on collected wireless IDs in association with location and time
US20210279232A1 (en) Chatbot Search System, Chatbot Search Method, and Program
US20070294149A1 (en) Catalog based price search
EP2081134A1 (en) Radio id managing apparatus, radio id managing method and radio id recorder
CN111062750A (zh) 用户画像标签建模和分析方法、装置、设备及存储介质
KR20050049750A (ko) 온라인 광고 시스템 및 방법
CN105894357A (zh) 商品信息推送方法及装置
CN101248435A (zh) 期望存储库的确定
JPH11259498A (ja) 文書処理装置および記録媒体
CN106126630A (zh) 一种业务对象的收藏、搜索方法和装置
CN103793388A (zh) 搜索结果的排序方法和装置
CN101458703A (zh) 用于控制相对重要性的标签表示或标签组表示大小调整
US20100174657A1 (en) System and method for appraisal information services
CN102216928B (zh) 用于检索数据并显示数据存储器的内容密度的方法和系统
CN103699549B (zh) 一种图形码库更新、查询方法及相关装置
CN115878903B (zh) 基于大数据的信息智能推荐方法
CN104050243A (zh) 一种将搜索与社交相结合的网络搜索方法及其系统
KR20050050016A (ko) 온라인 광고 시스템 및 방법
US7949576B2 (en) Method of providing product database
TWI554966B (zh) Electronic invoice data processing method
US7337029B2 (en) Design data management system and trace system
CN109660580B (zh) 一种信息推送方法及装置
CN108132940B (zh) 一种应用程序数据提取方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140430

Termination date: 20170911

CF01 Termination of patent right due to non-payment of annual fee