CN1625740A - 元数据的索引结构、提供元数据索引的方法、以及使用元数据的索引的元数据搜索方法和装置 - Google Patents
元数据的索引结构、提供元数据索引的方法、以及使用元数据的索引的元数据搜索方法和装置 Download PDFInfo
- Publication number
- CN1625740A CN1625740A CNA038028964A CN03802896A CN1625740A CN 1625740 A CN1625740 A CN 1625740A CN A038028964 A CNA038028964 A CN A038028964A CN 03802896 A CN03802896 A CN 03802896A CN 1625740 A CN1625740 A CN 1625740A
- Authority
- CN
- China
- Prior art keywords
- metadata
- multiple key
- value
- index
- key
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/81—Indexing, e.g. XML tags; Data structures therefor; Storage structures
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99944—Object-oriented database structure
- Y10S707/99945—Object-oriented database structure processing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99948—Application of database or data structure, e.g. distributed, multimedia, or image
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
提供一种用于搜索有关内容的信息的元数据的索引结构和一种用于提供所述元数据的索引的方法,以及一种使用所述元数据的索引结构来搜索元数据的方法和装置,其中所述元数据的索引结构包括多关键字值和对应于所述多关键字值的所述元数据的标识信息,其中所述多关键字由所述元数据的预定字段的组合构成。
Description
技术领域
本发明涉及为搜索有关内容的信息而提供的元数据的索引结构和用于提供元数据索引的方法,以及使用元数据的索引结构搜索元数据的方法和装置。更具体的,本发明涉及一种为搜索有关内容的信息而提供的元数据的索引结构和用于提供元数据索引的方法,以及使用元数据的索引搜索元数据的方法和装置,所述元数据包括多个多关键字,当由电视随时论坛(TV-AnytimeForum)定义的数字内容上的XML元数据(下文称作“TVA元数据”)被划分为段(fragment)而作为独立单元并基于段被发送时,通过使用所述多关键字可以更有效地搜索有关内容的信息。本申请基于韩国专利申请2002-43097以及2002-62923,在此通过引用并入。
背景技术
电视随时论坛是一种在1999年9月建立的私人标准组织,其用途在于开发用于提供在用户容易掌握使用的环境(例如具有高容量的个人存储器的个人数字记录器(PDR))中的视听相关服务的标准。具体的,服务的目的在于使所有用户能够基于个人存储器在期望的时间和以期望的方式来观看和收听各种类型的节目(例如传统广播服务,在线交互式服务等等)。
为了建立标准,电视随时论坛已经运作了商业模型、系统/传输接口/内容引用、描述、元数据、权利管理和保护等的工作组。对于本发明所涉及的元数据,直到2002年6月才公开“1st Draft of Metadata Specification SP003v1.3”。
将参考图1来简要描述PDR的结构。PDR 100经由诸如天波、卫星波、互联网等的各种网络从用于提供视频/音频信号的提供商200接收视频/音频信号和元数据,如果必需的话,搜集用户的观看和收听模式、以及个人喜好,并且将它们发送至用于提供视频/音频信号的提供商200。PDR 100包括高容量存储器,用于在其中存储所接收的视频/音频信号和元数据。PDR 100还包括用于存储和再现视频/音频信号的软件,以及用于检索并显示视频/音频信号的元数据的电子节目指南(EGP)应用程序。用户通过图2所示的EPG应用程序的网格指南屏幕,查明视频/音频数据的元数据,即节目的标题、节目再现次数等,选择期望的节目,并且经由网络实时接收该节目或者再现在高容量存储器中先前存储的视频/音频数据。
元数据是指描述诸如节目的标题和摘要的内容的数据,并被定义为“有关数据的数据”。在TV随时论坛的TVA元数据规范中,使用W3C(倡导XML标准的联盟)制定的标准XML模式语言来定义其结构(参见W3C的XML 1.0),并且还定义了各个元数据元素的语义和属性。有关广播内容的TVA元数据是利用具有根节点,即如图3所示的“TVAMain(300)”的XML文档来构造的。有关节目的TVA元数据是利用例如“ProgramDescription(节目描述)”节点之下的ProgramInformationTable(节目信息表)、GroupInformationTable(组信息表)、ProgramLocationTable(节目位置表)、ServiceInformationTable(服务信息表)等节点来构造的。
在TV随时论坛中,基于段作为独立单位来发送TVA元数据,以便以流格式发送大量TVA元数据。将参照图4简要说明段的概念。通过将利用图3所示的XML文档所构造的TVA元数据划分成预定的树结构来获得段。例如,在整个TVA元数据被划分成包含上层节点“TVAMain”和该上层节点之下的预定子节点的树结构(TVAMain段)、包含上层节点ProgramInformationTable和该上层节点之下的子节点的树结构(ProgramInformation段)和包含上层节点BroadcastEvent(广播事件)信息和该上层节点之下的子节点的树结构(BroadcastEvent段)的情况下,每个所划分的树结构都成为段。段能够独立于其他段被发送,并且段能够被单独地访问。
为了单独访问段,必须知道整个元数据树状结构中由所发送的TVA元数据段参考的节点,即对应于TVA元数据段的上层节点的节点,并且必须描述所发送的TVA元数据段中包含的关键字的TVA元数据段中的相对路径。为此,使用XPath,它是由W3C定义的XML文档中的用于描述到一个或多个节点的语法,并且也意味着由段参考的节点的子节点。由用户来输入字段(用于搜索条件),例如对应于关键字的“服务ID”和“发布时间”。
为了提供对段的有效搜索和访问,另外需要在元数据段中包含的关键字的索引结构,并且独立于元数据段,也发送有关索引结构的信息,即索引信息。
在由TV随时论坛提出的环境下,如果用户希望检索满足预定的发布时间条件的节目信息,独立于段发送的索引信息用于识别满足所需的发布时间条件的元数据段的位置(标识符),接着基于该位置(标识符)进行对相关元数据段的访问,以便提取满足发布时间条件的元数据。
2002年6月在加拿大蒙特利尔召开的TV-Anytime论坛第17次会议中,发表了TV-Anytime规范TV 145,J.P.Evain,“1st Draft of Metadata SpecificationSP003v1.3”,以下称作“Single key index art reference(单关键字索引现有参考)”,其中提出了一种用于元数据段索引的单关键字索引结构。
注意到,这里使用术语“单关键字”来区分于在以后描述的本发明的实施例中的术语“多关键字”的概念。根据本发明实施例的多关键字索引结构使用户能够同时使用多个关键字对于多个关键字访问元数据,但是现有技术的单关键字索引结构仅允许使用一个单关键字来访问元数据。
在描述索引结构之前,将描述由TV随时论坛定义的容器(container)的概念。
TV随时论坛定义容器为顶层存储器,覆盖上述索引信息和元数据段的所有数据被发送到该顶层存储器,这是一种被称作顶层发送的类型。下面简要描述容器,每个容器包括多个区(section),每个区中存储索引信息或元数据段。根据所承载的信息,容器可被划分成索引容器和数据容器:索引容器承载索引信息区,例如关键字索引列表(key_index_list)区、关键字索引(key_index)区、子关键字索引(sub_key_index)区、串仓库(string_repository)区和段数据仓库(fragment_data_repository)区,而数据容器承载元数据段区,例如元素表(elements_table)区、串仓库(string_repository)区和段数据仓库(fragment_data_repository)区。以上分类是基于容器中包含的信息内容进行的。索引容器和数据容器在结构上都是相同的。
参考如图5所图解的由TV随时论坛定义的容器,容器包括容器标识符(container_id)数据字段(未示出)和大量的区。在每个区中,根据‘section_id’中的编码值识别存储在‘section_body’中的内容。例如,其‘section_id’中编码值为‘0X0004’的区10被识别为关键字索引列表(key_index_list)区,其‘section_id’中编码值为‘0X0005’的区20被识别为关键字索引(key_index)区,其‘section_id’中编码值为‘0X0006’的区30被识别为子关键字索引(sub_key_index)区,其‘section_id’中编码值为‘0X0001’的区40被识别为元素表(elements_table)区,其‘section_id’中编码值为‘0X0003’的区50被识别为段数据仓库(fragment_data_repository)区。
TVA元数据段被存储在数据容器的段数据仓库(fragment_data_repository)区50中,接着被发送。数据容器中的TVA元数据段的标识信息(handle_value)被包含在数据容器的元素表区40中。
总之,TVA元数据段由包含该TVA元数据段的容器的容器标识符信息(container_id)和元数据段标识信息(handle_value)来唯一地识别。
上面描述的单关键字索引现有技术参考提出了用于索引在上述数据容器中存储的TVA元数据段的单关键字索引结构,即一种由关键字索引列表(key_index_list)区10、关键字索引(key_index)区20、以及子关键字索引(sub_key_index)区30组成的结构。由于在上面描述的单关键字索引参考中详细描述了结构的语法,因此不再对其详细描述。在下文,将参考图6来描述所述结构,图6通过索引信息的各部分来图解说明所述结构。
在单关键字索引结构中定义的关键字索引列表(key_index_list)区10提供了被发送的所有单关键字的列表。所述列表包括定义每个单关键字的单关键字信息以及有关关键字索引(key_index)区20的标识信息(将在以后描述)。该单关键字信息包括(1)有关单关键字的元数据段的位置信息,和(2)单关键字在元数据段内的位置信息以及对于关键字索引(key_index)区20的标识信息(将在以后描述)。在TVA中以XPath(fragment_xpath_ptr)表达元数据段的位置信息。在TVA中对于用作单关键字的节点的相关段内的相对路径,以XPath(key_xpath_ptr)表达单关键字的位置信息。
元数据段的XPath是一条到TVA元数据XML文档的根节点的路径,即,绝对路径,并且用作单关键字的节点的XPath,即单关键字的XPath代表对于相关元数据段的单关键字的相对路径。对于元数据段的XPath和对于单关键字的XPath分别存储在“fragment_xpath_ptr”部分(segment)11和“key_descriptor”部分12中。
而且,关键字索引列表(key_index_list)区10包括将在以后描述的每个单关键字的关键字索引(key_index)区20的标识信息(即,其中存储了关键字索引(key_index)区20的容器的容器标识符信息(container_id)以及关键字索引标识符信息)。所述容器标识符信息和关键字索引标识符信息分别存储在关键字索引列表(key_index_list)区10中的“index_container”部分和“key_index_identifier”部分,并随后被发送。
单关键字索引结构中定义的关键字索引(key_index)区20提供所有子关键字索引(sub_key_index)区30的列表(将在以后描述)。所述列表包括:代表在各个子关键字索引(sub_key_index)区30中包含的关键字值的范围的信息,即在每个子关键字索引(sub_key_index)区30内的关键字值当中的最高关键字值(在下文称作“代表关键字值”);以及有关每个代表关键字值的子关键字索引(sub_key_index)区30的标识信息(即,其中存储了子关键字索引(sub_key_index)区的容器的容器标识符信息(container_id)和子关键字索引标识符信息)。
相应地,关键字索引区(key_index)20包括:“key_index_identifier”部分,用于在其中存储在关键字索引列表(key_index_list)区10中定义的关键字索引标识符信息;“high_key_value”部分13,用于在其中存储各个子关键字索引(sub_key_index)区30的代表关键字值,其中存储了子关键字索引(sub_key_index)区30容器的容器标识符信息(container_id);“sub_index_container”部分,用于存储各个子关键字索引标识符信息;以及“sub_index_identifier”部分。在单关键字索引结构中定义的子关键字索引(sub_key_index)区30提供在相关子关键字索引(sub_key_index)区30中包含的关键字值的列表。所述列表包括在相关子关键字索引(sub_key_index)区30中包含的关键字值以及有关具有所述关键字值的元数据段的标识信息(即存储元数据段的容器的容器标识符信息(container_id)以及元数据段的标识信息(handle_value))。
相应地,子关键字索引(sub_key_index)区30包括:“sub_index_identifier”部分,其中存储了在关键字索引(key_index)区20中定义的子关键字索引标识符信息;“key_value”部分14,其中存储关键字值;“target_container”部分,用于在其中存储容器的容器标识符信息(container_id),在所述容器中存储了元数据段;和“target_handle”部分,用于在其中存储段数据标识符信息(handle_value)。通过参考图解说明索引信息的图7将更容易理解单关键字索引结构。
图7a和7b示出了包括有关服务Id、发布时间以及发布历时的单关键字的关键字索引列表(key_index_list)区。包括有关服务Id、发布时间以及发布历时的单关键字的元数据段的上层节点是如图3所示的用阴影块表示的“BroadcastEvent”310。相应地,在“fragment_xpath_ptr”部分11a中存储了用于“BroadcastEvent”段的XPath“/TVAMain/ProgramDescription/Program-LocationTable/BroadcastEvent”,在“key_xpath_ptr”部分12a中存储了用于“BroadcastEvent”段的有关字服务Id、发布时间以及发布历时的单关键的XPath,即“@ServiceId”(图3中的311a)、“EventDescription/PublishedTime”(图3中的311b)、以及“EventDescription/PublishedDuration”(图3中的311c)。
作为说明,图7a示出了关键字索引列表(key_index_list)区当中用于服务Id的关键字索引(key_index)区20a和子关键字索引(sub_key_index)区30a(单关键字的XPath:@ServiceId)。图7b示出用于发布时间的关键字索引(key_index)区20b和子关键字索引(sub_key_index)区30b(单关键字的XPath:EventDescription/PublishedTime)。
该单关键字索引结构的缺点在于不能有效地执行组合条件搜索,即通过一个或多个搜索条件的搜索,因为它仅能够支持单关键字搜索,即根据TV随时规范使用对应于元数据段的指定字段的关键字的索引搜索。例如,为了在图2所示的网格指南屏幕上显示广播节目的列表,需要两个字段(即服务Id和发布时间)的搜索操作。
为了解释使用传统单关键字索引结构的组合条件搜索,在下文将通过示例来解释这样一种情况:获得一个其中服务Id在范围507到514内以及发布时间从09:30到10:00的节目的列表。在TV随时元数据规范中,用于检索有关节目列的元数据的搜索条件表示如下。
-搜索的目标段(BroadcastEvent):
/TVAMain/ProgramDescription/ProgramLocationTable/BroadcastEvent,
-搜索条件列表:
507<=ServiceId<=514
09:00<=EventDescription/PublishedTime<=10:00。
在传统的单关键字索引结构中,可使用两种方法来获得满足指定的搜索条件的段。将参考图8a和8b来详细描述所述方法。
(1)使用单关键字索引的第一种搜索方法
在该第一种方法中,如图8a所示,使用ServiceId和EventDescription/PublishedTime各自的单关键字来独立搜索作为满足各自条件的中间结果的段组。之后,获得在两组独立搜索的段中公共的段,从中获得满足条件的最后结果组的段。
在下文,将参考图7a和8a来详细描述该方法。
首先,指定服务Id搜索所需的单关键字信息和单关键字值(S11)。该单关键字信息包括作为搜索目标元数据段的位置信息的搜索目标元数据段的XPath,以及作为在元数据段内的单关键字的位置信息的单关键字的XPath。
-元数据段的XPath:
/TVAMain/ProgramDescription/ProgramLocationTable/BroadcastEvent,
-服务Id的XPath:@ServiceId,
-服务Id的关键字值:507<=ServiceId<=514。
接着,从关键字索引列表(key_index_list)区10a中检索对应于段的XPath11a和服务Id的XPath 12a的单关键字,并且提取有关关键字索引(key_index)区20a的标识信息。在此基础上,从具有所提取的标识信息的关键字索引(key_index)区20a中检索代表关键字值“509”13a和“519”13a,即指示包含了将被搜索的单关键字的关键字值(507-514)的关键字值的范围(500-509,510-519)的代表关键字值。随后,提取具有有关代表关键字值“509”和“519”的关键字值(500-509,510-519)的有关子关键字索引(sub_key_index)区14a的标识信息。从具有所提取的标识信息的子关键字索引(sub_key_index)区14a中提取对应于关键字值507-514的元数据段的标识信息(分别存储在“target_container”部分和“target_handle”部分中的容器标识符信息(container_id)和段数据标识信息(handle_value)),并且通过使用所提取的标识信息来提取相关元数据段(S12,S14)。
例如为了搜索发布时间,单关键字信息,即搜索目标元数据段的XPath信息和单关键字的XPath信息,以及单关键字值表示如下。
-段的XPath:
/TVAMain/ProgramDescription/ProgramLoeation/BroadcastEvent,
-发布时间的XPath:EventDescription/PublishedTime,
-发布时间的关键字值:09:30<=EventDescription/PublishedTime<=10:00。通过与服务Id搜索中基本上相同的步骤来提取对应于关键字值09:30-10:00的元数据段(S13,S15)。
执行对于服务Id和发布时间的提取的元数据段之间的交集,并且将公共元数据段的元数据提供给图2所示的网格指南屏幕作为最后结果(S16)。
(2)使用单关键字索引的第二种搜索方法
在该第二种方法中,如图8b所示(S21-S23),使用涉及搜索条件的两个单关键字中的仅一个关键字(例如服务Id)来搜索段,并且从所搜索的段中仅选择作为另一个搜索条件的其发布时间在09:30和10:00之间的段(S24)。
由于通过使用各自的单关键字搜索而获得的中间结果段通常在数量上非常大,因此使用单关键字索引结构的这些搜索方法不太有效。在第一种方法中,由于相关服务Id的范围中的所有节目被作为独立于发布时间的范围的搜索结果而获得,并且对于所有服务Id的相关时间范围中的节目作为搜索结果而获得,因此搜索结果的大小可能变得非常大。而且,由于在组合大小较大的两个中间搜索结果的处理中计算也复杂了,因此接收装置的开销显著地增加。在第二种方法中,一个中间结果应当通过其他搜索条件另外地过滤。因此,使用单关键字索引结构的组合条件搜索可能导致接收装置的开销加重。
发明内容
本发明考虑解决上述问题。本发明的目的是提供一种有助于组合条件搜索有关内容的信息的元数据的多关键字索引结构。
本发明的另一目的是提供一种提供有助于有关内容的信息的组合条件的元数据的索引的方法,一种使用所述元数据的索引搜索元数据的方法以及一种使用该元数据的索引的搜索装置。
根据实现上面和其他目的的本发明的实施例,提供一种元数据的索引结构,包括:多关键字值;和对应于所述多关键字值的所述元数据的标识信息,其中所述多关键字由所述元数据的预定字段的组合构成。
优选的,所述索引结构还包括所述多关键字的列表。
优选的,所述索引结构还包括代表所述多关键字值的预定范围的代表关键字值。
理想的,所述代表关键字值包括在所述预定范围内的值当中的最大值、最小值或中间值中的至少一个。
理想的,所述元数据包括在树状数据结构中由预定范围划分的段,其中组成多关键字的字段对应于组成所述段的信息中的任何一个。
理想的,所述元数据的标识信息包括所述段的标识信息。
优选的,所述多关键字列表包括组成所述多关键字的字段所属于的段在所述数据结构中的位置信息以及字段在所述段中的位置信息。
优选的,所述位置信息以XPath表达。
更优选的,其中所述多关键字值在大小上的比较用以通过具有不同大小的值的字段来比较所述多关键字值的大小,所述字段是通过将优先级顺序(k1>k2>k3…kn)分配给组成所述多关键字(k1,k2,k3,…kn)的多个字段并且从具有最高优先级的字段开始依次比较字段而第一个出现,其中当不存在具有不同大小的值的字段时,确定两个多关键字值为相同大小;和当相关字段的值用数字表示时通过算术运算比较,或者当相关字段的值用字母表示时通过字母顺序来确定字段的大小。
理想的,所述元数据具有在TVA中定义的元数据的结构。
根据实现本发明的这些和其他目的的一个实施例,提供一种提供元数据的索引的方法,所述元数据包括多关键字值和对应于所述多关键字值的所述元数据的标识信息,其中所述多关键字由所述元数据的预定字段的组合构成。
优选的,所述元数据的索引包括多关键字列表。
理想的,所述元数据的索引还包括代表所述多关键字值的预定范围的代表关键字值。
优选的,所述代表关键字值包括所述预定范围内的值当中的最大值、最小值或中间值中的至少一个。
优选的,所述元数据包括在树状数据结构中由预定范围划分的段,其中组成多关键字的字段对应于组成所述段的信息中的任何一个。
优选的,所述元数据的标识信息是指所述段的标识信息。
优选的,所述多关键字列表包括组成所述多关键字的字段所属于的段在所述数据结构中的位置信息以及字段在所述段中的位置信息。
优选的,所述位置信息以XPath表达。
理想的,所述多关键字值根据预定规则以大小为基础依次排列。
更理想的,所述多关键字值在大小上的比较用以通过具有不同大小的值的字段来比较所述多关键字值的大小,所述字段是通过将优先级顺序(k1>k2>k3…kn)分配给组成所述多关键字(k1,k2,k3,…kn)的多个字段并且从具有最高优先级的字段开始依次比较字段而第一个出现,其中当不存在具有不同大小的值的字段时,确定两个多关键字值为相同大小;和当相关字段的值用数字表示时通过算术运算比较,或者当相关字段的值用字母表示时通过字母顺序来确定字段的大小。
理想的,所述元数据具有在TVA中定义的元数据的结构。
根据实现本发明的一个实施例,也提供一种搜索元数据的方法,包括下列步骤:(a)允许用户输入搜索条件;(b)从元数据索引中搜索对应于所输入的搜索条件的多关键字值;和(c)通过使用搜索到的多关键字值来提取相关元数据。
理想的,所述多关键字由所述元数据的预定字段的组合构成。
理想的,所述元数据索引包括所述多关键字值和对应于所述多关键字值的元数据的标识信息。
理想的,所述元数据索引包括多关键字列表。
理想的,所述元数据还包括代表所述多关键字值的预定范围的代表关键字值。
优选的,所述代表关键字值包括所述预定范围内的值当中的最大值、最小值或中间值中的至少一个。
更优选的,所述元数据包括在树状数据结构中由预定范围划分的段,其中组成多关键字的字段对应于组成所述段的信息中的任何一个。
优选的,所述元数据的标识信息是指所述段的标识信息。
更优选的,所述多关键字列表包括组成所述多关键字的字段所属于的段在所述数据结构中的位置信息以及字段在所述段中的位置信息。
更优选的,所述位置信息以XPath表达。
优选的,所述元数据具有在TVA中定义的元数据的结构。
更优选的,在搜索所述多关键字值的步骤中,搜索与所输入的搜索条件值相比具有相同大小的多关键字值。
理想的,所述多关键字值在大小上的比较用以通过具有不同大小的值的字段来比较所述多关键字值的大小,所述字段是通过将优先级顺序(k1>k2>k3…kn)分配给组成所述多关键字(k1,k2,k3,…kn)的多个字段并且从具有最高优先级的字段开始依次比较字段而第一个出现,其中当不存在具有不同大小的值的字段时,确定两个多关键字值为相同大小;和当相关字段的值用数字表示时通过算术运算比较,或者当相关字段的值用字母表示时通过字母顺序来确定字段的大小。
理想的,提取相关元数据的步骤(c)包括下列步骤:(c1)在所述元数据索引中提取对应于搜索到的多关键字值的元数据的标识信息;和(c2)通过使用所提取的标识信息来提取相关元数据。
优选的,搜索所述多关键字值的步骤(b)包括步骤:(b1)搜索满足所输入的搜索条件的代表关键字值;和(b2)在代表所述代表关键字值的范围中的所述多关键字值当中搜索满足所输入的搜索条件的多关键字值。
优选的,搜索所述多关键字值的步骤(b)包括步骤:(b3)在所述多关键字列表中搜索满足搜索条件的多关键字;和(b4)在由搜索到的多关键字索引的多关键字值当中搜索满足所输入的搜索条件的多关键字。
优选的,搜索所述多关键字的步骤(b3)包括步骤:(b3-1)确定所述搜索条件的字段所属的段在所述数据结构中的位置信息,和字段在所述段中的位置信息;和(b3-2)从所述多关键字列表中搜索用具有对应于上面确定的位置信息的位置信息的字段构造的多关键字。
优选的,在由搜索到的多关键字索引的所述多关键字值当中搜索满足所输入的搜索条件的多关键字的步骤(b4)包括步骤:(b4-1)搜索满足所输入的搜索条件的代表值;和(b4-2)在由所述代表关键字所代表的多关键字值当中搜索满足所输入的搜索条件的多关键字值。
根据实现本发明的这些和其他目的的一个实施例,提供一种搜索元数据的装置,包括:允许用户输入搜索条件的输入单元;和控制单元,在元数据索引中搜索满足所输入的搜索条件的多关键字值,并且通过使用所搜索的多关键字值来提取相关元数据。
优选的,所述多关键字由所述元数据的预定字段的组合构成。
更优选的,所述元数据索引包括所述多关键字值以及对应于所述多关键字值的元数据的标识信息。
理想的,所述元数据索引包括多关键字列表。
理想的,所述元数据还包括代表所述多关键字值的预定范围的代表关键字值。
理想的,所述代表关键字值包括所述预定范围内的值当中的最大值、最小值或中间值中的至少一个。
优选的,所述元数据包括在树状数据结构中由预定范围划分的段,其中组成多关键字的字段对应于组成所述段的信息中的任何一个。
优选的,所述元数据的标识信息是指所述段的标识信息。
更优选的,所述多关键字列表包括组成所述多关键字的字段所属于的段在所述数据结构中的位置信息以及字段在所述段中的位置信息。
理想的,所述位置信息以XPath表达。
理想的,所述元数据具有在TVA中定义的元数据的结构。
优选的,所述控制单元从所述元数据索引中搜索通过比较所输入的搜索条件的值与多关键字值而获得的大小上相等的多关键字值。
优选的,所述多关键字值在大小上的比较用以通过具有不同大小的值的字段来比较所述多关键字值的大小,所述字段是通过将优先级顺序(k1>k2>k3…kn)分配给组成所述多关键字(k1,k2,k3,…kn)的多个字段并且从具有最高优先级的字段开始依次比较字段而第一个出现,其中当不存在具有不同大小的值的字段时,确定两个多关键字值为相同大小;和当相关字段的值用数字表示时通过算术运算比较,或者当相关字段的值用字母表示时通过字母顺序来确定字段的大小。
优选的,所述控制器提取所述元数据索引中对应于所搜索的多关键字值的元数据的标识信息,并且通过使用所提取的标识信息来提取相关元数据。
优选的,所述控制器搜索满足所输入的搜索条件的代表关键字值,并且在由所述代表值表示的预定范围中的多关键字值当中搜索满足所输入的搜索条件的多关键字值。
优选的,所述控制器从所述多关键字列表中搜索满足所述搜索条件的多关键字,并且在由所搜索的多关键字索引的多关键字值当中搜索满足所输入的搜索条件的多关键字值。
优选的,所述控制器确定所述搜索条件的字段所属的段在数据结构内的位置信息,以及字段在所述段内的位置信息,并且从所述多关键字列表中搜索用具有对应于所确定的位置信息的位置信息的字段构造的多关键字。
优选的,所述控制器搜索满足所输入的搜索条件的代表关键字值,并且在由所述代表值代表的范围中的多关键字值当中搜索满足所输入的搜索条件的多关键字值。
优选的,所述装置还包括:接收单元,用于接收所述元数据和所述元数据索引;存储单元,用于在其中存储所述元数据和所述元数据索引;以及输出单元,用于输出所述控制单元的搜索结果。
因此,通过使用多关键字索引方案能够更有效地执行元数据的组合条件搜索。
附图说明
从以下结合附图给出的优选实施例的描述中,本发明的上述和其它方面和特征将会变得明显而且更容易理解,其中:
图1是图解说明普通PDR的概念的示意图;
图2示出了普通EPG应用中的网格指南屏幕;
图3示出了由TV随时论坛所定义的普通元数据的结构;
图4是图解说明由TV随时论坛所定义的普通段的概念的示意图;
图5是图解说明由TV随时论坛所定义的普通容器的概念的示意图;
图6示出了采用传统单关键字概念的元数据的索引结构;
图7图解说明了使用传统单关键字方案的元数据的索引结构以及搜索处理;
图8是图解说明使用传统单关键字方案搜索元数据的搜索方法的图;
图9示出了根据本发明实施例的基于多关键字方案的元数据的索引结构;
图10示出了根据本发明实施例的使用多关键字方案的元数据的索引结构以及搜索处理;
图11图解说明了根据本发明实施例的用于提供元数据的索引的方法;
图12是示出根据本发明实施例的用于搜索元数据的方法的图;以及
图13是图解说明根据本发明实施例的用于搜索元数据的装置的示意图。
具体实施方式
在下文,将参考附图来详细描述一种被提供用来搜索有关内容的信息的元数据的索引结构,一种用于提供元数据索引的方法,以及一种使用元数据的索引来搜索元数据的方法和装置的实施例。
为了描述,将在本说明书中基于TVA元数据来描述实施例;然而,这不应当被解释和理解为对本发明的保护范围的限制。
首先将描述定义作为用于搜索有关内容的信息的元数据的索引结构的多关键字索引结构的语法,随后将描述由所述语法定义的多关键字索引结构,所述多关键字索引结构是一种由关键字索引列表(key_index_list)区110、关键字索引(key_index)区120、以及子关键字索引(sub_key_index)区130组成的结构,用于索引所发送的并存储在数据容器中的TVA元数据段。
与单关键字索引现有技术参考中定义的语法不同,定义元数据的索引结构,也就是根据本发明实施例的多关键字索引结构的语法,包括为多关键字索引概念新近引入的结构,它包括key_descriptor(),high_key_value_descriptor()和key_value_descriptor(),并且重新组织关键字索引列表(key_index_list)区、关键字索引(key_index)区、以及子关键字索引(sub_key_index)区的结构。
1.关键字索引列表(key_index_list)区
该关键字索引列表(key_index_list)区提供所有发送的多关键字的列表。在每个关键字索引列表(key_index_list)结构中,包括key_descriptor(),从而能够进行多关键字索引,如表1所示。
表1
语法 | 位数(可变化) |
key_index_list(){ | |
for(j=0;j<key_index_count;j++){ | |
fragment_xpath_ptr | 16 |
key_descriptor() | |
index_container | 16 |
key_index_identifier | 8 |
} | |
} | |
key_index_count:指定所有发送的多关键字的数量,即整个XML文档的索引的数目。
fragment_xpath_ptr():描述了将被索引的元数据的目标段的XPath,即将被索引的元数据的目标段的位置信息。
key_descriptor():描述了多关键字的XPath将被索引的元数据的目标段组的XPath之内的位置,即多关键字在元数据段之内的位置信息,以及在组成多关键字的每个元素/属性中的编码指示符的信息。
index_container:标识其中存在指定的关键字索引(key_index)区的容器。
key_index_identifier:标识由index_ontainer指定的容器之内的关键字索引(key_index)区。通过index_container和key_index_identifier的组合以唯一方式能够标识关键字索引(key_index)区。
2.关键字描述符(key_descriptor)
多关键字是组合关键字。对于组成多关键字的多个关键字,key_descriptor描述了诸如关键字的XPath的关键字的特性。下表2示出了该key_descriptor。
表2
语法 | 位数(可变化) |
key_descriptor(){ | |
key_attribute_count | 8 |
for(j=0;j<key_attribute_count;j++){ | |
key_xpath_ptr | 16 |
} | |
} |
key_attribute_count:指定组成多关键字的关键字的数量。
key_xpath_ptr:指示相对于用作多关键字的节点(关键字)的fragment_xpath_ptr的路径。
3.关键字索引(key_index)区
high_value_descriptor()是新近引入的。
在本发明的这个实施例中,high_value_descriptor()指示相对于由关键字索引(key_index)区指示的子关键字索引(sub_key_index)区的数量(sub_index_count)那样多的子关键字索引(sub_key_index)区、代表相关子关键字索引(sub_key_index)区之内的多关键字的值的代表关键字的值。high_key_value_descriptor()指定相关子关键字索引(sub_key_index)区之内的多关键字值当中的最大值。然而,可以使用任何参考值,只要它代表包括最小值或中间值等的相关子关键字索引(sub_key_index)区之内的预定范围值之内的多关键字的值,作为本发明的另一个实施例。
表3
语法 | 位数(可变化) |
key_index(){ | |
key_index_identifier | 8 |
sub_index_count | 8 |
for(j=0;j<sub_index_count;j++){ |
high_key_value_descriptor() | 16*key_attribute_count |
sub_index_container | 16 |
sub_index_identifier | 8 |
} | |
} |
key_index_identifier:标识由index_container指定的容器内的关键字索引(key_index)区。可以通过index_container和key_index_identifier的组合以唯一方式来标识该关键字索引(key_index)区。这在关键字索引列表(key_index_list)区中被定义。
sub_index_container:标识其中存在所指定的子关键字索引(sub_key_index)的容器。
sub_index_identifier:标识由sub_index_container指定的容器内的子关键字索引(sub_key_index)区。可以通过sub_index_container和sub_index_identifier的组合以唯一方式来标识子关键字索引(sub_key_index)。
下表4示出了high_key_value_descriptor()。
语法 | 位数(可变化) |
high_key_value_descriptor(){ | |
for(j=0;j<key_attribute_count;j++){ | |
key_attribute_value | 16 |
} | |
} |
key_attribute_count:指定组成多关键字的关键字的数量。它在关键字索引列表(key_index_list)区中被定义。
key_attribute_value:代表每个关键字的代表关键字值。该值编码格式与单关键字索引方案的key_value相同。
如果high_key_value_descriptor()具有一个多关键字值,则如下执行多关键字值的大小的比较。当多关键字值用数字表示时,则基于算术运算来比较它们;当多关键字值用字母表示,则以字母顺序来排列它们。对于由关键字k1、k2…kn组成的多关键字(k1、k2…kn),假设k1具有最高优先级,kn具有最低优先级。在这种假设下,考虑两个多关键字(a1、a2…an)和(b1、b2…bn)的值,
*如果并且仅如果存在整数i(0≤i≤n-1),使得对于每个j(0≤j≤i-1),aj=bj并且ai>bi,则多关键字(a1、a2…an)的值大于多关键字(b1、b2…bn)的值。
*如果并且仅如果存在整数i(0≤i≤n-1),使得对于每个j(0≤j≤i-1),aj=bj并且ai<bi,则多关键字(a1、a2…an)的值小于多关键字(b1、b2…bn)的值。
*如果并且仅如果对于每个i(0≤i≤n),ai=bi,则多关键字(a1、a2…an)的值等于多关键字(b1、b2…bn)的值。
4.子关键字索引(sub_key_index)区
key_value_descriptor()是对于多关键字索引方案而新近引入的。key_value_descriptor()代表由此指示的目标段的多关键字值。
表5
语法 | 位数(可变化) |
sub_key_index(){ | |
sub_index_identifier | 8 |
reference_count | 8 |
for(j=0;j<reference_count;j++){ | |
key_value_descriptor() | 16*key_attribute_count |
target_container | 16 |
target_handle | 16 |
} | |
} |
sub_index_identifier:标识由sub_index_container标识的容器内的子关键字索引(sub_key_index)区。可通过sub_index_container和sub_index_identifier的组合以唯一方式来标识子关键字索引(sub_key_index)。它在关键字索引(key_index)区中被定义。
reference_count:指定sub_key_index中包含的多关键字的数目。
target_container:标识其中存在指定的元数据段的容器。
target_handle:标识由target_container标识的容器内的元数据段区。可以通过target_container和target_handle的组合以唯一方式来标识元数据段区。
下表6示出了key_value_descriptor()。
表6
语法 | 位数(可变化) |
key_value_descriptor(){ | |
for(j=0;j<key_attribute_count;j++){ | |
key_attribute_value | 16 |
} | |
} |
key_attribute_count:指定组成多关键字的关键字的数量。它在关键字索引列表区中被定义。
key_attribute_value:代表每个关键字值。该格式等于单关键字索引现有参考中的key_value。
key_value_descriptor()值之间的比较与关键字索引(key_index)区结构中的high_key_value_descriptor()值之间的比较相同。
在下文,将参考图9来讨论上述语法所定义的元数据结构,使用索引信息上的部分(segment)来图解说明该元数据结构。
元数据结构中定义的关键字索引列表(key_index_list)区110提供了被发送的所有多关键字的列表。所述列表包括定义每个多关键字的多关键字信息以及有关关键字索引(key_index)区120的标识信息(将在以后描述)。多关键字信息包括(1)有关多关键字的元数据段的位置信息(在TVA中表示为对于有关多关键字的元数据段的XPath(fragment_xpath_ptr)),和(2)多关键字在元数据段内的位置信息(在TVA中表示为对于用作多关键字的节点的XPath(key_descriptor),即有关用作多关键字的节点的元数据段的XPath位置中的相关路径)。与单索引结构类似,元数据段的XPath是指对于TVA元数据XML文档的根节点的路径,即,绝对路径,并且用作多关键字的节点的XPath,即多关键字的XPath是指多关键字对于元数据段的相对路径。元数据段的XPath和多关键字的XPath分别存储在“fragment_xpath_ptr”部分111和“key_descriptor”部分112中。
关键字索引列表(key_index_list)区110也包括有关每个多关键字(将在以后描述)的关键字索引(key_index)区120的标识信息(即其中存储了关键字索引(key_index)区120的容器的容器标识符信息(container_id)以及关键字索引标识符信息)。所述容器标识符信息和关键字索引标识符信息分别存储在关键字索引列表(key_index_list)区110中的“index_container”部分和“key_index_identifier”部分,并随后被发送。
多关键字索引数据流结构中定义的关键字索引(key_index)区120提供所有子关键字索引(sub_key_index)区130的列表(将在以后描述)。所述列表包括:有关在各个子关键字索引(sub_key_index)区130中包含的多关键字值的范围的信息,即代表在每个子关键字索引(sub_key_index)区130中包含的多关键字值的代表关键字值(在该实施例中,为多关键字的最高值);以及对于有关每个代表值的子关键字索引(sub_key_index)区130的标识信息(即,其中存储了子关键字索引(sub_key_index)区的容器的容器标识符信息(container_id)和子关键字索引标识符信息)。在该实施例中用于比较多关键字值的方法与参照表4描述的比较多关键字值的方法相同。
关键字索引区(key_index)120包括:“key_index_identifier”部分,用于在其中存储在关键字索引列表(key_index_list)区110中定义的关键字索引标识符信息;“high_key_value_descriptor”部分113,用于在其中存储每个子关键字索引(sub_key_index)区130的代表关键字值;以及有关子关键字索引(sub_key_index)区130的标识信息,所述子关键字索引区130包括对应于由代表关键字值指示的范围的多关键字值。有关子关键字索引(sub_key_index)区130a的标识信息包括:“sub_key_container”部分,用于在其中存储容器的容器标识符信息(container_id),在所述容器中存储了子关键字索引(sub_key_index)区130;和“sub_index_identifier”部分,用于在其中存储子关键字索引数据标识信息。
元数据结构中定义的子关键字索引(sub_key_index)区130提供在相关子关键字索引(sub_key_index)区130中包含的多关键字值的列表。所述列表提供在相关子关键字索引(sub_key_index)区130中包含的多关键字值、以及有关具有所述多关键字值的元数据段的标识信息(即,其中存储了元数据段的容器的容器标识符信息(container_id)和有关元数据段的标识信息(handle_value))。
子关键字索引(sub_key_index)区130包括:“sub_index_identifier”部分,用于在其中存储在关键字索引(key_index)区120中定义的子关键字索引标识符信息;“key_value_descriptor”部分114,用于在其中存储多关键字值;以及有关具有多关键字值的元数据段的标识信息。有关具有多关键字值的元数据段的标识信息包括:“target_container”部分,用于在其中存储容器的容器标识符信息(container_id),在所述容器中存储了元数据段;和“target_handle”部分,用于在其中存储段数据标识符信息(handle_value)。
通过图解说明了索引信息的图10将更容易理解元数据结构。
图10示出了包括服务ID和发布时间的多关键字的多关键字索引列表(key_index_list)区。包括有关服务ID和发布时间的多关键字的元数据段的上层节点是“BroadcastEvent”310,如图3中阴影区域所示。因此,用于“BroadcastEvent”段的XPath“/TVAMain/ProgramDescription/ProgramLocationTable/BroadcastEvent”可以存储在“fragment_xpath_ptr”部分111中,并且用于“BroadcastEvent”段的服务ID和发布时间的多关键字的XPath,即“@ServiceId”311a和“EventDescription/PublishedTime”311b可以存储在“key_descriptor”部分112中。
当根据多个条件实施搜索时,即当实施组合条件搜索时,该元数据流结构允许有效地实施搜索和访问元数据段。
尽管本实施例通过示例形式参考了服务Id和发布时间的多关键字,但是也可以组合采用各种多关键字。例如,可以使用用于与广播时间表相关的节目的开始和结束时间的多关键字,以及节目中涉及的个人(演员、导演等)的姓和名的多关键字等等。
当使用与广播时间表相关的节目的开始和结束时间的多关键字时,包括用于节目的开始和结束时间的多关键字的元数据段的上层节点可以是“Schedule(时间表)”(未示出)。因此,用于“Schedule”段的XPath“/TVAMain/ProgramDescription/ProgramLocation Table/Schedule”可以存储在“fragment_xpath_ptr”部分111中,并且用于“Schedule”段的节目的开始和结束时间的多关键字的XPath“@start”和“@end”可以存储在“key_descriptor”部分112中。
当使用节目中涉及的个人(演员、导演等)的姓和名的多关键字时,包括个人(演员、导演等)的姓和名的多关键字的元数据段的上层节点可以是“PersonName”(未示出),并且因此,用于“PersonName”段的XPath“/TVAMain/Program Description/CreditsInformationTable/PersonName”可以存储在“fragment_xpath_ptr”部分111中,并且用于“PersonName”段的节目中的个人的姓和名的多关键字的XPath“FamilyName”和“GivenName”可以存储在“key_descriptor”部分112中。
图11叙述了一种提供具有根据本发明实施例的结构的元数据的索引的方法。如所叙述的,可以通过提供音频/视频信号的提供商200来产生元数据的索引。
如上所述以段为单位处理大量有关内容的信息,即元数据(S100)。通过组合涉及有关内容的信息的关键字,例如“服务ID”和“发布时间”来提供多关键字(S200)。然后,通过如在步骤S200提供的多关键字,换句话说,通过形成多关键字的关键字来提供子关键字索引(sub_key_index)区114a和114b(S300),其中在子关键字索引(sub_key_index)区114a和114b中包括根据预定范围划分的多关键字值,并且在子关键字索引(sub_key_index)区114a和114b中也包括元数据段标识信息,所述元数据段标识信息包括多关键字值(即分别存储在图9所示的“target_container”部分和“target_handle”部分中的容器标识符信息(container_id))和段数据标识信息(handle_value))。
随后,提供关键字索引(key_index)区120,所述关键字索引区120包含代表根据预定范围划分的多关键字值的代表关键字值(S400)。例如,其中包含了代表组合的服务ID/发布时间的多关键字值的预定范围(500~509/09:10~10:00 114a,510~519/09:10~10:00 114b等)的代表关键字值(“509/10:00”113a,“519/10:00”113b等)。在该实施例中,服务ID具有在发布时间以上的更上层优先级。关键字索引(key_index)区120中包含了有关子关键字索引(sub_key_index)区114a和114b的标识信息,在所述子关键字索引区114a和114b中存储了根据预定范围提供的多关键字值(即,其中存储了图9的子关键字索引(sub_key_index)区的容器的容器标识符信息(container_id)和子关键字索引标识符信息)。
同时,提供关键字索引列表(key_index_list)区110(S500),在所述关键字索引列表区110中根据多关键字排列着多关键字信息,即,组成所提供的多关键字的每个字段所属的元数据段的位置信息以及元数据段内的每个字段的位置信息。例如,当关键字“服务Id”和“公布时间”组合时,在关键字索引列表(key_index_list)区110中包含组合的“服务Id”和“公布时间”的多关键字信息,诸如用于索引的目标元数据段的XPath(/TVAMain/ProgramDescription/ProgramLocationTable/BroadcastEvent)和用于元数据段的多关键字的XPath(服务Id的XPath“@ServiceID”和发布时间的XPath“EventDescription/PublishedTime”)。
在本发明的其他实施例中上面步骤能够以相反顺序进行。而且,根据本发明的一些实施例,可以删除提供包括代表关键字值的关键字索引(key_index)区120的步骤(S400)或者提供关键字索引列表(key_index_list)区的步骤(S500)。
下面,将参考图12来描述通过使用根据上述本发明实施例的、多关键字索引结构来获取满足多于一个搜索条件的元数据的搜索方法。
首先,由用户输入搜索的条件(S1100)。根据元数据索引来搜索满足所输入的搜索条件的多关键字值(S1200)。通过使用对应于使用搜索到的多关键字值的多关键字值的元数据段的标识信息来提取相关元数据段(S1300)。通过这些步骤,提取了满足搜索条件的元数据。在由用户输入的搜索条件中,包括了将被搜索的字段和字段值。
搜索多关键字值的步骤(S1200)包括步骤:确定所输入的搜索条件的字段所属的元数据段的位置信息以及字段在元数据段内的位置信息(S1210);通过使用所确定的位置信息,在关键字索引列表(key_index_list)区110中搜索由具有与上述确定的位置信息相同的位置信息的字段组成的多关键字,并且搜索相对于搜索到的多关键字的关键字索引(key_index)区120(S1220);在关键字索引(key_index)区120中搜索由作为搜索条件输入的字段值组成的代表关键字值,并且搜索包括在由上面搜索到的代表关键字值指示的范围中的多关键字值的子关键字索引(sub_key_index)区114a和114b(S1230);以及在上面搜索的子关键字索引(sub_key_index)区114a和114b中搜索满足搜索条件的多关键字值(S1240)。
在上述步骤S1220、S1230和S1300,通过使用关键字索引(key_index)区120的标识信息、子关键字索引(sub_keyi_ndex)区的标识信息以及元数据段的标识信息来分别执行搜索关键字索引(key_index)区120、子关键字索引(sub_key_index)区、以及提取元数据段的步骤。
在搜索参考图10描述的服务Id和发布时间时,能够以下列方式利用如图12所示的搜索方法:
当用户输入搜索条件为服务Id“507~514”和发布时间“9:30~10:00”时(S1100),根据结合“507~514”范围中的服务Id以及“9:30~10:00”范围中的发布时间的字段来确定相关元数据段的位置信息,并且确定字段在元数据段内的位置信息(S1210)。
作为搜索条件输入的服务Id和发布时间各自具有“@ServiceId”和“EventDescription/PublishedTime”作为在元数据段内的位置信息。在该基础上,确定作为相关段的属性的相关元数据段的位置信息,即XPath(S1210)。
总之,我们从上列步骤可以获得如下:
段的XPath:
/TVAMain/ProgramDescription/ProgramLocationTable/BroadcastEent
-服务Id的XPath:@ServiceId,
-发布时间的XPath:EventDescription/PublishedTime
-服务Id的值:507<=ServiceId<=514,
-发布时间的值:9:30<=EventDescription/PublishedTime<=10:00
随后,在关键字索引列表(key_index_list)区110中搜索对应于元数据段的XPath 111和服务Id/发布时间的XPath 112的多关键字,并且提取有关包括搜索到的多关键字的关键字索引(key_index)区120的标识信息(S1220)。在本发明的实施例中,服务Id的优先级高于发布时间。从具有所提取的标识信息的关键字索引(key_index)区120中搜索代表关键字值“509/10:00”113a和“519/10:00”113b,即指示对应于搜索条件的多关键字值(507-514/09:30-10:00)所属的多关键字值的范围(500-509/09:10-10:00 114a,510-519/09:10-10:00 114b)的代表关键字值,并且提取有关具有代表值的子关键字索引(sub_key_index)区114a和114b的标识信息(S1230)。从具有所提取的标识信息的子关键字索引(sub_key_index)区114a和114b中搜索与对应于搜索条件的多关键字值(507~514/09:30~10:00)的多关键字值对应的,包括关键字值“507/09:30”,“507/09:40”,…“509/10:00”和“510/09:30”,“510/09:40”,…“514/10:00”的多关键字的值(S1240)。
提取有关对应于搜索到的多关键字值的元数据段的标识信息(分别存储在“target_container”部分和“target_handle”部分中的容器标识符信息(container_id)和段数据标识符信息(handle_value)),并且随后通过使用所提取的标识信息来提取相关的元数据段(S1300)。
图13示出了根据本发明实施例的用于搜索元数据的装置。本发明的搜索装置是根据参考图12上述的本发明实施例执行搜索元数据的方法的装置。
搜索装置包括:输入单元1100,允许用户于此输入搜索条件;接收单元1200,用于接收有关内容的元数据或者元数据的索引;存储单元1300,用于在其中存储所接收的内容、有关内容的元数据或者元数据的索引;控制单元1400,用于根据元数据索引搜索对应于从输入单元110输入的搜索条件的多关键字值,并且通过使用搜索到的多关键字值来提取有关的元数据;和输出单元1500,用于输出控制单元1400的搜索结果。
控制单元1400将从输入单元1100输入的搜索条件与存储单元中存储的元数据索引中包含的多关键字值进行比较。
在根据本发明的一个实施例的搜索多关键字值的步骤当中,通过参考关于图12做出的描述,将会理解搜索对应于所输入搜索条件的多关键字的步骤(S1200),或者通过使用对应于所搜索的多关键字的段的标识信息来提取有关段的步骤。
根据本发明,提供一种允许更有效地搜索和访问有关内容的信息的元数据的索引结构,一种提供具有所述结构的元数据索引的方法,以及一种使用所述元数据索引搜索元数据的方法和装置。
工业实用性
如上所述,本发明能够通过组合条件来同时搜索TV随时元数据。当通过组合条件进行搜索TV随时元数据时,减少了搜索装置的开销,从而缩短了搜索时间并且增加了搜索装置的效率。
尽管已经结合附图所示的优选实施例描述了本发明,但是仅是说明性的。本领域的技术人员将会理解在不脱离本发明的范围和精神的情况下可以做出各种修改和等效物。因此,本发明的范围应当仅由所附权利要求来限定。
Claims (58)
1.一种元数据的索引结构,包括:
多关键字值;和
对应于所述多关键字值的所述元数据的标识信息,
其中所述多关键字由所述元数据的预定字段的组合构成。
2.如权利要求1所述的索引结构,还包括所述多关键字的列表。
3.如权利要求2所述的索引结构,还包括代表所述多关键字的值的第一预定范围的代表关键字值。
4.如权利要求3所述的索引结构,其中所述代表关键字值包括在所述第一预定范围内的值当中的最大值、最小值或中间值中的至少一个。
5.如权利要求3所述的索引结构,其中所述元数据包括在树状数据结构中由第二预定范围划分的段,其中组成第一多关键字的第一字段对应于组成所述段的信息中的任何一个。
6.如权利要求5所述的索引结构,其中所述元数据的标识信息包括所述段的标识信息。
7.如权利要求5所述的索引结构,其中所述多关键字列表包括组成所述第一多关键字的第一字段所属于的第一段在所述数据结构中的位置信息以及所述第一字段在第一段中的位置信息。
8.如权利要求7所述的索引结构,其中所述位置信息以XPath表达。
9.如权利要求1所述的索引结构,其中所述多关键字值在大小上的比较用以通过具有不同大小的值的字段来比较所述多关键字值的大小,所述字段是通过将优先级顺序(k1>k2>k3...kn)分配给组成所述多关键字(k1,k2,k3,...kn)的多个组合的字段并且从具有最高优先级的第一多关键字字段开始依次比较组合的字段而第一个出现,其中
当不存在具有不同大小的值的字段时,确定两个多关键字值为相同大小;和
当相关字段的值用数字表示时通过算术运算比较,或者当相关字段的值用字母表示时通过字母顺序来确定组合字段的大小。
10.如权利要求1所述的索引结构,其中所述元数据具有在TVA中定义的元数据的结构。
11.一种提供元数据的索引的方法,包括:
通过组合所述元数据的预定字段来构造多关键字;
其中所述元数据的索引包括所述多关键字值和对应于所述多关键字值的元数据的标识信息。
12.如权利要求11所述的方法,其中所述元数据的索引包括多关键字列表。
13.如权利要求12所述的方法,其中所述元数据的索引还包括代表所述多关键字值的第一预定范围的代表关键字值。
14.如权利要求13所述的方法,其中所述代表关键字值包括所述第一预定范围内的值当中的最大值、最小值或中间值中的至少一个。
15.如权利要求13所述的方法,其中所述元数据包括在树状数据结构中由第二预定范围划分的段,其中组成第一多关键字的第一字段对应于组成所述段的信息中的任何一个。
16.如权利要求15所述的方法,其中所述元数据的标识信息是指所述段的标识信息。
17.如权利要求15所述的方法,其中所述多关键字列表包括组成所述第一多关键字的第一字段所属于的第一段在所述数据结构中的位置信息以及第一字段在所述第一段中的位置信息。
18.如权利要求17所述的方法,其中所述位置信息以XPath表达。
19.如权利要求11所述的方法,其中所述多关键字值根据预定规则以大小为基础依次排列。
20.如权利要求19所述的方法,其中所述多关键字值在大小上的比较用以通过具有不同大小的值的字段来比较所述多关键字值的大小,所述字段是通过将优先级顺序(k1>k2>k3...kn)分配给组成所述多关键字(k1,k2,k3,...kn)的多个组合的字段并且从具有最高优先级的第一多关键字字段开始依次比较组合的字段而第一个出现,其中
当不存在具有不同大小的值的字段时,确定两个多关键字值为相同大小;和
当相关字段的值用数字表示时通过算术运算比较,或者当相关字段的值用字母表示时通过字母顺序来确定组合字段的大小。
21.如权利要求11所述的方法,其中所述元数据具有在TVA中定义的元数据的结构。
22.一种搜索元数据的方法,包括下列步骤:
(a)输入搜索条件;
(b)从元数据索引中搜索对应于所输入的搜索条件的多关键字值;和
(c)通过使用搜索到的多关键字值来提取相关元数据。
23.如权利要求22所述的方法,其中所述多关键字由所述元数据的预定字段的组合构成。
24.如权利要求22所述的方法,其中所述元数据索引包括所述多关键字值和对应于所述多关键字值的元数据的标识信息。
25.如权利要求24所述的方法,其中所述元数据索引包括多关键字列表。
26.如权利要求25所述的方法,其中所述元数据还包括代表所述多关键字值的第一预定范围的代表关键字值。
27.如权利要求26所述的方法,其中所述代表关键字值包括所述第一预定范围内的值当中的最大值、最小值或中间值中的至少一个。
28.如权利要求26所述的方法,其中所述元数据包括在树状数据结构中由第二预定范围划分的段,其中组成多关键字的第一字段对应于组成所述段的信息中的任何一个。
29.如权利要求28所述的方法,其中所述元数据的标识信息是指所述段的标识信息。
30.如权利要求28所述的方法,其中所述多关键字列表包括组成所述多关键字的第一字段所属于的第一段在所述数据结构中的位置信息以及第一字段在所述第一段中的位置信息。
31.如权利要求30所述的方法,其中所述位置信息以XPath表达。
32.如权利要求22所述的方法,其中所述元数据具有在TVA中定义的元数据的结构。
33.如权利要求22所述的方法,其中在搜索所述多关键字值的步骤中,搜索与所输入的搜索条件值相比具有相同大小的多关键字值。
34.如权利要求33所述的方法,其中所述多关键字值在大小上的比较用以通过具有不同大小的值的字段来比较所述多关键字值的大小,所述字段是通过将优先级顺序(k1>k2>k3...kn)分配给组成所述多关键字(k1,k2,k3,...kn)的多个字段并且从具有最高优先级的第一多关键字字段开始依次比较字段而第一个出现,其中
当不存在具有不同大小的值的字段时,确定两个多关键字值为相同大小;和
当相关字段的值用数字表示时通过算术运算比较,或者当相关字段的值用字母表示时通过字母顺序来确定字段的大小。
35.如权利要求24所述的方法,其中提取相关元数据的步骤(c)包括下列步骤:
(c1)在所述元数据索引中提取对应于搜索到的多关键字值的元数据的标识信息;和
(c2)通过使用所提取的标识信息来提取相关元数据。
36.如权利要求26所述的方法,其中搜索所述多关键字值的步骤(b)包括步骤:
(b1)搜索满足所输入的搜索条件的代表关键字值;和
(b2)在代表所述代表关键字值的范围中的所述多关键字值当中搜索满足所输入的搜索条件的多关键字值。
37.如权利要求30所述的方法,其中搜索所述多关键字值的步骤(b)包括步骤:
(b3)在所述多关键字列表中搜索满足搜索条件的多关键字;和
(b4)在由搜索到的多关键字索引的多关键字值当中搜索满足所输入的搜索条件的多关键字。
38.如权利要求37所述的方法,其中搜索所述多关键字的步骤(b3)包括步骤:
(b3-1)确定所述搜索条件的第一字段所属的第一段在所述数据结构中的位置信息,和第一字段在所述第一段中的位置信息;和
(b3-2)从所述多关键字列表中搜索用具有对应于上面确定的位置信息的位置信息的字段构造的关键字值。
39.如权利要求37所述的方法,其中在由搜索到的多关键字索引的所述多关键字值当中搜索满足所输入的搜索条件的多关键字的步骤(b4)包括步骤:
(b4-1)搜索满足所输入的搜索条件的代表值;和
(b4-2)在由所述代表关键字所代表的多关键字值当中搜索满足所输入的搜索条件的多关键字值。
40.一种搜索元数据的装置,包括:
允许用户输入搜索条件的输入单元;和
控制单元,在元数据索引中搜索满足所输入的搜索条件的多关键字值,并且通过使用所搜索的多关键字值来提取相关元数据。
41.如权利要求40所述的装置,其中所述多关键字由所述元数据的预定字段的组合构成。
42.如权利要求40所述的装置,其中所述元数据索引包括所述多关键字值以及对应于所述多关键字值的元数据的标识信息。
43.如权利要求42所述的装置,其中所述元数据索引包括多关键字列表。
44.如权利要求43所述的装置,其中所述元数据还包括代表所述多关键字值的第一预定范围的代表关键字值。
45.如权利要求44所述的装置,其中所述代表关键字值包括所述第一预定范围内的值当中的最大值、最小值或中间值中的至少一个。
46.如权利要求44所述的装置,其中所述元数据包括在树状数据结构中由第二预定范围划分的段,其中组成多关键字的第一字段对应于组成所述段的信息中的任何一个。
47.如权利要求46所述的装置,其中所述元数据的标识信息是指所述段的标识信息。
48.如权利要求46所述的装置,其中所述多关键字列表包括组成所述多关键字的第一字段所属于的第一段所述数据结构中的位置信息以及第一字段在所述第一段中的位置信息。
49.如权利要求48所述的装置,其中所述位置信息以XPath表达。
50.如权利要求40所述的装置,其中所述元数据具有在TVA中定义的元数据的结构。
51.如权利要求40所述的装置,其中所述控制单元从所述元数据索引中搜索通过比较所输入的搜索条件的值与多关键字值而获得的大小上相等的多关键字值。
52.如权利要求51所述的装置,其中所述多关键字值在大小上的比较用以通过具有不同大小的值的字段来比较所述多关键字值的大小,所述字段是通过将优先级顺序(k1>k2>k3...kn)分配给组成所述多关键字(k1,k2,k3,...kn)的多个字段并且从具有最高优先级的第一多关键字字段开始依次比较字段而第一个出现,其中
当不存在具有不同大小的值的字段时,确定两个多关键字值为相同大小;和
当相关字段的值用数字表示时通过算术运算比较,或者当相关字段的值用字母表示时通过字母顺序来确定字段的大小。
53.如权利要求42所述的装置,其中所述控制器提取所述元数据索引中对应于所搜索的多关键字值的元数据的标识信息,并且通过使用所提取的标识信息来提取相关的元数据。
54.如权利要求44所述的装置,其中所述控制器搜索满足所输入的搜索条件的代表关键字值,并且在由所述代表关键字值表示的第一预定范围中的多关键字值当中搜索满足所输入的搜索条件的多关键字值。
55.如权利要求48所述的装置,其中所述控制器从所述多关键字列表中搜索满足所述搜索条件的多关键字,并且在由所搜索的多关键字索引的多关键字值当中搜索满足所输入的搜索条件的多关键字值。
56.如权利要求55所述的装置,其中所述控制器确定所述搜索条件的字段所属的段在数据结构内的位置信息,以及字段在所述段内的位置信息,并且从所述多关键字列表中搜索用具有对应于所确定的位置信息的位置信息的字段构造的多关键字。
57.如权利要求55所述的装置,其中所述控制器搜索满足所输入的搜索条件的代表关键字值,并且在由所述代表关键字值代表的范围中的多关键字值当中搜索满足所输入的搜索条件的多关键字值。
58.如权利要求40所述的装置,还包括:
接收单元,用于接收所述元数据和所述元数据索引;
存储单元,用于在其中存储所述元数据和所述元数据索引;以及
输出单元,用于输出所述控制单元的搜索结果。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20020043097 | 2002-07-23 | ||
KR10-2002-0043097 | 2002-07-23 | ||
KR10-2002-0062923 | 2002-10-15 | ||
KR20020062923 | 2002-10-15 |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004100825960A Division CN100401290C (zh) | 2002-07-23 | 2003-07-16 | 使用元数据的索引的元数据搜索方法和装置 |
CN2004100825956A Division CN1591428B (zh) | 2002-07-23 | 2003-07-16 | 提供元数据索引的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1625740A true CN1625740A (zh) | 2005-06-08 |
Family
ID=36117020
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA038028964A Pending CN1625740A (zh) | 2002-07-23 | 2003-07-16 | 元数据的索引结构、提供元数据索引的方法、以及使用元数据的索引的元数据搜索方法和装置 |
CN2004100825956A Expired - Fee Related CN1591428B (zh) | 2002-07-23 | 2003-07-16 | 提供元数据索引的方法 |
CNB2004100825960A Expired - Fee Related CN100401290C (zh) | 2002-07-23 | 2003-07-16 | 使用元数据的索引的元数据搜索方法和装置 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2004100825956A Expired - Fee Related CN1591428B (zh) | 2002-07-23 | 2003-07-16 | 提供元数据索引的方法 |
CNB2004100825960A Expired - Fee Related CN100401290C (zh) | 2002-07-23 | 2003-07-16 | 使用元数据的索引的元数据搜索方法和装置 |
Country Status (12)
Country | Link |
---|---|
US (4) | US7343381B2 (zh) |
EP (3) | EP1569138A1 (zh) |
JP (3) | JP2005534102A (zh) |
KR (2) | KR100419767B1 (zh) |
CN (3) | CN1625740A (zh) |
AU (1) | AU2003281658C1 (zh) |
BR (2) | BR0318369A2 (zh) |
GB (1) | GB2397406B (zh) |
MX (1) | MXPA04008378A (zh) |
RU (3) | RU2304804C2 (zh) |
SG (2) | SG142159A1 (zh) |
WO (1) | WO2004010335A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101257501B (zh) * | 2008-04-11 | 2011-07-27 | 杭州华三通信技术有限公司 | 数据导入方法、系统及Web服务器 |
CN103500183A (zh) * | 2013-09-12 | 2014-01-08 | 国家计算机网络与信息安全管理中心 | 一种基于多个相关字段组合索引存储结构及建立、查询与维护方法 |
CN104426926A (zh) * | 2013-08-21 | 2015-03-18 | 腾讯科技(深圳)有限公司 | 定时发布数据的处理方法及装置 |
Families Citing this family (92)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6236395B1 (en) * | 1999-02-01 | 2001-05-22 | Sharp Laboratories Of America, Inc. | Audiovisual information management system |
US8028314B1 (en) | 2000-05-26 | 2011-09-27 | Sharp Laboratories Of America, Inc. | Audiovisual information management system |
US7490092B2 (en) | 2000-07-06 | 2009-02-10 | Streamsage, Inc. | Method and system for indexing and searching timed media information based upon relevance intervals |
US8020183B2 (en) * | 2000-09-14 | 2011-09-13 | Sharp Laboratories Of America, Inc. | Audiovisual management system |
US20030061610A1 (en) * | 2001-03-27 | 2003-03-27 | Errico James H. | Audiovisual management system |
US7904814B2 (en) | 2001-04-19 | 2011-03-08 | Sharp Laboratories Of America, Inc. | System for presenting audio-video content |
US20030121040A1 (en) * | 2001-07-02 | 2003-06-26 | Ferman A. Mufit | Audiovisual management system |
US20030206710A1 (en) * | 2001-09-14 | 2003-11-06 | Ferman Ahmet Mufit | Audiovisual management system |
US7474698B2 (en) | 2001-10-19 | 2009-01-06 | Sharp Laboratories Of America, Inc. | Identification of replay segments |
US8214741B2 (en) * | 2002-03-19 | 2012-07-03 | Sharp Laboratories Of America, Inc. | Synchronization of video and data |
US7657907B2 (en) * | 2002-09-30 | 2010-02-02 | Sharp Laboratories Of America, Inc. | Automatic user profiling |
US7380205B2 (en) * | 2003-10-28 | 2008-05-27 | Sap Ag | Maintenance of XML documents |
US7594245B2 (en) * | 2004-03-04 | 2009-09-22 | Sharp Laboratories Of America, Inc. | Networked video devices |
US8949899B2 (en) * | 2005-03-04 | 2015-02-03 | Sharp Laboratories Of America, Inc. | Collaborative recommendation system |
US8356317B2 (en) * | 2004-03-04 | 2013-01-15 | Sharp Laboratories Of America, Inc. | Presence based technology |
KR100619064B1 (ko) * | 2004-07-30 | 2006-08-31 | 삼성전자주식회사 | 메타 데이터를 포함하는 저장 매체, 그 재생 장치 및 방법 |
US7895218B2 (en) * | 2004-11-09 | 2011-02-22 | Veveo, Inc. | Method and system for performing searches for television content using reduced text input |
US7627425B2 (en) * | 2004-11-26 | 2009-12-01 | Microsoft Corporation | Location aware mobile-device software development |
FI20041689A0 (fi) * | 2004-12-30 | 2004-12-30 | Nokia Corp | Mediavirran merkintä ja/tai jakaminen solukkoverkon päätteessä |
KR100742613B1 (ko) * | 2005-01-07 | 2007-07-25 | 한국전자통신연구원 | Ued 분류체계 정보를 이용한 맞춤형 방송 서비스 제공 장치 및 방법 |
KR100848126B1 (ko) * | 2005-01-07 | 2008-07-24 | 한국전자통신연구원 | 게임 메타데이터를 이용한 맞춤형 방송 서비스 제공 장치및 방법 |
US8520703B2 (en) * | 2005-04-05 | 2013-08-27 | Nokia Corporation | Enhanced electronic service guide container |
US7646886B2 (en) * | 2005-05-11 | 2010-01-12 | Lockheed Martin Corporation | Closely-spaced multiple targets detection using a regional window as a discriminant function |
US7788266B2 (en) | 2005-08-26 | 2010-08-31 | Veveo, Inc. | Method and system for processing ambiguous, multi-term search queries |
US7779011B2 (en) | 2005-08-26 | 2010-08-17 | Veveo, Inc. | Method and system for dynamically processing ambiguous, reduced text search queries and highlighting results thereof |
US8316132B2 (en) * | 2005-09-08 | 2012-11-20 | Nokia Corporation | Method to determine the completeness of a service guide |
US20070073751A1 (en) * | 2005-09-29 | 2007-03-29 | Morris Robert P | User interfaces and related methods, systems, and computer program products for automatically associating data with a resource as metadata |
US20070073770A1 (en) * | 2005-09-29 | 2007-03-29 | Morris Robert P | Methods, systems, and computer program products for resource-to-resource metadata association |
US7797337B2 (en) | 2005-09-29 | 2010-09-14 | Scenera Technologies, Llc | Methods, systems, and computer program products for automatically associating data with a resource as metadata based on a characteristic of the resource |
KR100765364B1 (ko) * | 2005-11-02 | 2007-10-10 | 전자부품연구원 | 메타데이터를 이용한 이종 단말 간의 멀티미디어 컨텐츠관리 시스템 |
US7644054B2 (en) * | 2005-11-23 | 2010-01-05 | Veveo, Inc. | System and method for finding desired results by incremental search using an ambiguous keypad with the input containing orthographic and typographic errors |
US20070198542A1 (en) * | 2006-02-09 | 2007-08-23 | Morris Robert P | Methods, systems, and computer program products for associating a persistent information element with a resource-executable pair |
US20070203898A1 (en) * | 2006-02-24 | 2007-08-30 | Jonathan Lurie Carmona | Search methods and systems |
US9300920B2 (en) * | 2006-03-03 | 2016-03-29 | Sharp Laboratories Of America, Inc. | Method and system for configuring media-playing sets |
US8689253B2 (en) * | 2006-03-03 | 2014-04-01 | Sharp Laboratories Of America, Inc. | Method and system for configuring media-playing sets |
US7739280B2 (en) | 2006-03-06 | 2010-06-15 | Veveo, Inc. | Methods and systems for selecting and presenting content based on user preference information extracted from an aggregate preference signature |
US8073860B2 (en) | 2006-03-30 | 2011-12-06 | Veveo, Inc. | Method and system for incrementally selecting and providing relevant search engines in response to a user query |
US7809741B2 (en) * | 2006-03-31 | 2010-10-05 | Microsoft Corporation | Generating and utilizing composite keys in lieu of compound keys |
EP4209927A1 (en) | 2006-04-20 | 2023-07-12 | Veveo, Inc. | User interface methods and systems for selecting and presenting content based on user navigation and selection actions associated with the content |
US7574435B2 (en) * | 2006-05-03 | 2009-08-11 | International Business Machines Corporation | Hierarchical storage management of metadata |
US20080025691A1 (en) * | 2006-07-31 | 2008-01-31 | Sharp Kabushiki Kaisha | Content reproduction apparatus, content reproduction method, content reproduction system, content data sending apparatus, content data sending method, program, and storage medium |
US8397083B1 (en) * | 2006-08-23 | 2013-03-12 | Netapp, Inc. | System and method for efficiently deleting a file from secure storage served by a storage system |
CA2989780C (en) | 2006-09-14 | 2022-08-09 | Veveo, Inc. | Methods and systems for dynamically rearranging search results into hierarchically organized concept clusters |
US7925986B2 (en) | 2006-10-06 | 2011-04-12 | Veveo, Inc. | Methods and systems for a linear character selection display interface for ambiguous text input |
US8078884B2 (en) | 2006-11-13 | 2011-12-13 | Veveo, Inc. | Method of and system for selecting and presenting content based on user identification |
US8316302B2 (en) | 2007-05-11 | 2012-11-20 | General Instrument Corporation | Method and apparatus for annotating video content with metadata generated using speech recognition technology |
WO2008148012A1 (en) | 2007-05-25 | 2008-12-04 | Veveo, Inc. | System and method for text disambiguation and context designation in incremental search |
US8943539B2 (en) | 2007-11-21 | 2015-01-27 | Rovi Guides, Inc. | Enabling a friend to remotely modify user data |
EP2073491A1 (en) * | 2007-12-21 | 2009-06-24 | Thomson Licensing | Method of management of metadata size of a service guide |
US8078693B2 (en) * | 2008-04-14 | 2011-12-13 | Microsoft Corporation | Inserting a multimedia file through a web-based desktop productivity application |
US20090262722A1 (en) * | 2008-04-21 | 2009-10-22 | Honeywell International Inc. | Method to Calculate Transitive Closure of Multi-Path Directed Network Based on Declarative MetaData |
US9442933B2 (en) | 2008-12-24 | 2016-09-13 | Comcast Interactive Media, Llc | Identification of segments within audio, video, and multimedia items |
US8713016B2 (en) | 2008-12-24 | 2014-04-29 | Comcast Interactive Media, Llc | Method and apparatus for organizing segments of media assets and determining relevance of segments to a query |
US11531668B2 (en) | 2008-12-29 | 2022-12-20 | Comcast Interactive Media, Llc | Merging of multiple data sets |
US8176043B2 (en) | 2009-03-12 | 2012-05-08 | Comcast Interactive Media, Llc | Ranking search results |
US20100250614A1 (en) * | 2009-03-31 | 2010-09-30 | Comcast Cable Holdings, Llc | Storing and searching encoded data |
WO2010128491A1 (en) * | 2009-05-08 | 2010-11-11 | Nokia Corporation | Method and apparatus for configuring presentation of service guides |
US8533223B2 (en) | 2009-05-12 | 2013-09-10 | Comcast Interactive Media, LLC. | Disambiguation and tagging of entities |
US9892730B2 (en) | 2009-07-01 | 2018-02-13 | Comcast Interactive Media, Llc | Generating topic-specific language models |
CN102473185B (zh) * | 2009-07-07 | 2014-02-26 | 日本电气株式会社 | 信息搜索系统、信息管理设备、信息搜索方法、信息管理方法、以及记录介质 |
JP5096619B2 (ja) | 2009-07-15 | 2012-12-12 | ネオパッド インコーポレーション | ホームページ統合サービス提供システム及び方法 |
US9166714B2 (en) | 2009-09-11 | 2015-10-20 | Veveo, Inc. | Method of and system for presenting enriched video viewing analytics |
JP5493627B2 (ja) * | 2009-09-15 | 2014-05-14 | ソニー株式会社 | 情報処理装置、データ管理方法、およびプログラム |
JP2011065546A (ja) * | 2009-09-18 | 2011-03-31 | Hitachi Solutions Ltd | ファイル検索システム及びプログラム |
US9264342B2 (en) * | 2009-12-24 | 2016-02-16 | Samsung Electronics Co., Ltd. | Terminal device based on content name, and method for routing based on content name |
US20110191332A1 (en) | 2010-02-04 | 2011-08-04 | Veveo, Inc. | Method of and System for Updating Locally Cached Content Descriptor Information |
US9047301B2 (en) * | 2010-04-19 | 2015-06-02 | Greenbytes, Inc. | Method for optimizing the memory usage and performance of data deduplication storage systems |
KR20120035030A (ko) * | 2010-10-04 | 2012-04-13 | 한국전자통신연구원 | 서비스 검색을 제공하는 방법 및 그 시스템 |
EP2993814B1 (en) * | 2011-08-29 | 2020-04-22 | Sony Corporation | Ait transmission apparatus and method, reception apparatus and receiving method |
KR20130049111A (ko) * | 2011-11-03 | 2013-05-13 | 한국전자통신연구원 | 분산 처리를 이용한 포렌식 인덱스 방법 및 장치 |
US9154335B2 (en) * | 2011-11-08 | 2015-10-06 | Marvell Israel (M.I.S.L) Ltd. | Method and apparatus for transmitting data on a network |
US10192199B2 (en) * | 2011-11-16 | 2019-01-29 | Microsoft Technology Licensing, Llc | Enabling service features within productivity applications |
JP5143295B1 (ja) | 2012-01-27 | 2013-02-13 | 株式会社東芝 | 電子機器及びインデックス生成方法 |
WO2013116779A1 (en) | 2012-02-01 | 2013-08-08 | Futurewei Technologies, Inc. | System and method for organizing multimedia content |
CN102663090B (zh) * | 2012-04-10 | 2013-11-06 | 华为技术有限公司 | 元数据查询方法和装置 |
US9619487B2 (en) | 2012-06-18 | 2017-04-11 | International Business Machines Corporation | Method and system for the normalization, filtering and securing of associated metadata information on file objects deposited into an object store |
US8861513B2 (en) | 2012-06-26 | 2014-10-14 | International Business Machines Corporation | Fault tolerant parallel receiver interface with receiver redundancy |
US9001842B2 (en) | 2012-06-26 | 2015-04-07 | International Business Machines Corporation | Parallel receiver interface with receiver redundancy |
EP2682879A1 (en) | 2012-07-05 | 2014-01-08 | Thomson Licensing | Method and apparatus for prioritizing metadata |
US9665623B1 (en) * | 2013-03-15 | 2017-05-30 | EMC IP Holding Company LLC | Key-value store utilizing ranged keys in skip list data structure |
CN104378400B (zh) * | 2013-08-15 | 2018-10-02 | 腾讯科技(深圳)有限公司 | 数据分散并发方法和装置 |
US11430024B2 (en) | 2013-09-04 | 2022-08-30 | Amos M. Cohen | System and method of providing a virtual guestbook |
TWI559772B (zh) * | 2014-07-11 | 2016-11-21 | 聯詠科技股份有限公司 | 檔案搜尋方法及其影像處理裝置 |
US10152491B2 (en) | 2014-07-11 | 2018-12-11 | Novatek Microelectronics Corp. | File searching method and image processing device thereof |
EP3790200A1 (en) | 2015-11-20 | 2021-03-10 | Hewlett-Packard Development Company, L.P. | Print material container comprising memory storing compressed xml and printer extracting the xml to control an operation |
RU2611602C1 (ru) * | 2015-12-07 | 2017-02-28 | Российская Федерация, от имени которой выступает Министерство обороны Российской Федерации | Способ выбора аэрокосмических изображений из баз данных по критериям пользователя и формирования покрытия участка местности на их основе |
US10762139B1 (en) * | 2016-09-29 | 2020-09-01 | EMC IP Holding Company LLC | Method and system for managing a document search index |
US11030242B1 (en) * | 2018-10-15 | 2021-06-08 | Rockset, Inc. | Indexing and querying semi-structured documents using a key-value store |
CN110008732B (zh) * | 2018-12-29 | 2023-02-24 | 创新先进技术有限公司 | 数据的关联方法、装置及设备 |
CN111814003B (zh) * | 2019-04-12 | 2024-04-23 | 伊姆西Ip控股有限责任公司 | 用于建立元数据索引的方法、电子设备和计算机程序产品 |
US11409720B2 (en) | 2019-11-13 | 2022-08-09 | Western Digital Technologies, Inc. | Metadata reduction in a distributed storage system |
CN116955363B (zh) * | 2023-09-21 | 2023-12-26 | 北京四维纵横数据技术有限公司 | 无模式数据创建索引方法、装置、计算机设备及介质 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1996017313A1 (en) * | 1994-11-18 | 1996-06-06 | Oracle Corporation | Method and apparatus for indexing multimedia information streams |
US6175835B1 (en) * | 1996-07-26 | 2001-01-16 | Ori Software Development, Ltd. | Layered index with a basic unbalanced partitioned index that allows a balanced structure of blocks |
US5884304A (en) * | 1996-09-20 | 1999-03-16 | Novell, Inc. | Alternate key index query apparatus and method |
JPH1115845A (ja) | 1997-06-25 | 1999-01-22 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索方法および装置と情報検索プログラムを格納した記録媒体 |
US5940841A (en) * | 1997-07-11 | 1999-08-17 | International Business Machines Corporation | Parallel file system with extended file attributes |
US6151624A (en) * | 1998-02-03 | 2000-11-21 | Realnames Corporation | Navigating network resources based on metadata |
US6226618B1 (en) * | 1998-08-13 | 2001-05-01 | International Business Machines Corporation | Electronic content delivery system |
EP1133866A4 (en) * | 1998-11-25 | 2009-03-11 | Sony Electronics Inc | METHOD AND APPARATUS FOR ACCESSING MEMORIZED DIGITAL PROGRAMS |
US20020123928A1 (en) * | 2001-01-11 | 2002-09-05 | Eldering Charles A. | Targeting ads to subscribers based on privacy-protected subscriber profiles |
US6496830B1 (en) * | 1999-06-11 | 2002-12-17 | Oracle Corp. | Implementing descending indexes with a descend function |
US6418448B1 (en) * | 1999-12-06 | 2002-07-09 | Shyam Sundar Sarkar | Method and apparatus for processing markup language specifications for data and metadata used inside multiple related internet documents to navigate, query and manipulate information from a plurality of object relational databases over the web |
JP3752945B2 (ja) * | 2000-02-17 | 2006-03-08 | 日本電気株式会社 | ディレクトリ検索システム及び方法、ディレクトリ検索プログラムを記録したコンピュータ読取可能な記録媒体 |
US20020174147A1 (en) * | 2000-05-19 | 2002-11-21 | Zhi Wang | System and method for transcoding information for an audio or limited display user interface |
US6535885B1 (en) * | 2000-10-16 | 2003-03-18 | Aether Systems, Inc. | Multikeyed table implementable on a personal digital assistant |
EP1346559A4 (en) | 2000-11-16 | 2006-02-01 | Mydtv Inc | SYSTEM AND METHOD FOR DETERMINING THE POPULARITY OF VIDEO PROGRAM EVENTS |
KR20020043097A (ko) | 2000-12-01 | 2002-06-08 | 이계안 | 회전체가 장착된 피스톤 |
US6804677B2 (en) * | 2001-02-26 | 2004-10-12 | Ori Software Development Ltd. | Encoding semi-structured data for efficient search and browsing |
US20020184195A1 (en) * | 2001-05-30 | 2002-12-05 | Qian Richard J. | Integrating content from media sources |
US6823329B2 (en) * | 2002-04-02 | 2004-11-23 | Sybase, Inc. | Database system providing methodology for acceleration of queries involving functional expressions against columns having enumerated storage |
-
2003
- 2003-07-16 BR BRPI0318369-6A patent/BR0318369A2/pt not_active Application Discontinuation
- 2003-07-16 GB GB0318233A patent/GB2397406B/en not_active Expired - Fee Related
- 2003-07-16 BR BR0306985-0A patent/BR0306985A/pt not_active Application Discontinuation
- 2003-07-16 CN CNA038028964A patent/CN1625740A/zh active Pending
- 2003-07-16 WO PCT/KR2003/001410 patent/WO2004010335A1/en active Application Filing
- 2003-07-16 AU AU2003281658A patent/AU2003281658C1/en not_active Ceased
- 2003-07-16 SG SG200505063-8A patent/SG142159A1/en unknown
- 2003-07-16 CN CN2004100825956A patent/CN1591428B/zh not_active Expired - Fee Related
- 2003-07-16 SG SG200505062-0A patent/SG142158A1/en unknown
- 2003-07-16 RU RU2004122641/09A patent/RU2304804C2/ru not_active IP Right Cessation
- 2003-07-16 EP EP05075898A patent/EP1569138A1/en not_active Ceased
- 2003-07-16 EP EP03741584A patent/EP1546923A4/en not_active Ceased
- 2003-07-16 CN CNB2004100825960A patent/CN100401290C/zh not_active Expired - Fee Related
- 2003-07-16 EP EP05075897A patent/EP1645976A3/en not_active Ceased
- 2003-07-16 JP JP2004522813A patent/JP2005534102A/ja active Pending
- 2003-07-22 US US10/623,658 patent/US7343381B2/en not_active Expired - Fee Related
- 2003-07-22 KR KR10-2003-0050184A patent/KR100419767B1/ko not_active IP Right Cessation
-
2004
- 2004-01-19 KR KR10-2004-0003990A patent/KR100513287B1/ko not_active IP Right Cessation
- 2004-05-14 US US10/845,211 patent/US7444357B2/en not_active Expired - Fee Related
- 2004-05-14 US US10/845,443 patent/US7428553B2/en not_active Expired - Fee Related
- 2004-08-27 MX MXPA04008378A patent/MXPA04008378A/es active IP Right Grant
- 2004-10-14 RU RU2004129933/09A patent/RU2304304C2/ru not_active IP Right Cessation
- 2004-10-14 RU RU2004129934/09A patent/RU2304805C2/ru not_active IP Right Cessation
-
2005
- 2005-02-01 JP JP2005025703A patent/JP4319632B2/ja not_active Expired - Fee Related
- 2005-02-01 JP JP2005025702A patent/JP2005222545A/ja active Pending
-
2007
- 2007-10-30 US US11/928,723 patent/US8307009B2/en not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101257501B (zh) * | 2008-04-11 | 2011-07-27 | 杭州华三通信技术有限公司 | 数据导入方法、系统及Web服务器 |
CN104426926A (zh) * | 2013-08-21 | 2015-03-18 | 腾讯科技(深圳)有限公司 | 定时发布数据的处理方法及装置 |
CN104426926B (zh) * | 2013-08-21 | 2019-03-29 | 腾讯科技(深圳)有限公司 | 定时发布数据的处理方法及装置 |
US11314703B2 (en) | 2013-08-21 | 2022-04-26 | Tencent Technology (Shenzhen) Company Limited | Method and apparatus for processing timedly-published data |
CN103500183A (zh) * | 2013-09-12 | 2014-01-08 | 国家计算机网络与信息安全管理中心 | 一种基于多个相关字段组合索引存储结构及建立、查询与维护方法 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1625740A (zh) | 元数据的索引结构、提供元数据索引的方法、以及使用元数据的索引的元数据搜索方法和装置 | |
CN1606743A (zh) | 元数据的索引结构、提供元数据索引的方法和使用元数据索引的元数据搜索方法及设备 | |
CN1218265C (zh) | 数据库检索装置及方法 | |
CN1533163A (zh) | 电子节目指南数据的自由文本和属性搜索 | |
CN1242337C (zh) | 用于访问在一个网络上的信息的方法和系统 | |
CN1530926A (zh) | 语音识别词典制作装置及信息检索装置 | |
CN101069181A (zh) | 存储设备和记录介质 | |
CN1606295A (zh) | 元数据分配管理系统、装置和方法及其计算机程序 | |
CN1401188A (zh) | Mpeg-7样品的二进制格式 | |
CN1627297A (zh) | 管理用标记语言写的数据的方法及其设备 | |
CN1653452A (zh) | 管理数据库系统中的表达式 | |
CN1757020A (zh) | 信息处理装置、信息处理方法以及计算机程序 | |
CN1492669A (zh) | 产生节目信息的方法和装置以及处理节目信息的接收装置 | |
CN1975735A (zh) | 可排序集合的浏览器 | |
CN1315017A (zh) | 包含内部引用的两种版本数据表格之间的差别提取 | |
CN101047827A (zh) | 用于采集广播节目信息的电子设备、方法和系统以及存储介质 | |
CN101047826A (zh) | 电子设备、其信息浏览方法以及存储介质 | |
CN1825929A (zh) | 用于搜索和提供内容的系统和方法 | |
CN1321277A (zh) | 数据库系统 | |
CN1396770A (zh) | 结构化元数据的合并方法、传输方法以及分割方法 | |
CN101080927A (zh) | 内容推荐装置 | |
CN1855284A (zh) | 再现装置、再现控制方法以及程序 | |
CN1682217A (zh) | 媒体资料合成 | |
CN1313561A (zh) | 信息结构化及应用产生的方法及其装置 | |
CN1272272A (zh) | 内容提供系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |