CN102999637A - 根据文件特征码为文件自动添加文件标签的方法及系统 - Google Patents

根据文件特征码为文件自动添加文件标签的方法及系统 Download PDF

Info

Publication number
CN102999637A
CN102999637A CN2012105905114A CN201210590511A CN102999637A CN 102999637 A CN102999637 A CN 102999637A CN 2012105905114 A CN2012105905114 A CN 2012105905114A CN 201210590511 A CN201210590511 A CN 201210590511A CN 102999637 A CN102999637 A CN 102999637A
Authority
CN
China
Prior art keywords
file
eigenvalue
information
label
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012105905114A
Other languages
English (en)
Other versions
CN102999637B (zh
Inventor
王晖
黄祖莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Original Assignee
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Office Software Inc, Zhuhai Kingsoft Office Software Co Ltd filed Critical Beijing Kingsoft Office Software Inc
Priority to CN201210590511.4A priority Critical patent/CN102999637B/zh
Publication of CN102999637A publication Critical patent/CN102999637A/zh
Application granted granted Critical
Publication of CN102999637B publication Critical patent/CN102999637B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于文件存储管理技术领域,具体公开了一种根据文件特征码为文件自动添加文件标签的方法及系统。本发明方法是根据第一文件的内容信息获得与所述第一文件内容一一对应的文件特征码信息,再根据第一文件的属性信息生成第一文件标签集合,在文件特征码数据存储系统中查找是否已经存在与所述第一文件相同的文件特征码信息,若已存在,则将存在于所述第一文件标签集合中且不存在于第二文件标签集合中的文件标签信息添加到第二文件标签集合中;若不存在,则将所述第一文件的文件特征码信息、文件内容和文件标签集合分别存储至所述文件特征码数据存储系统中。本发明方法和系统可实现文件的多重信息存储管理,提高文件的分类管理和查找效率。

Description

根据文件特征码为文件自动添加文件标签的方法及系统
技术领域
本发明属于文件存储管理技术领域,具体涉及一种根据文件特征码为文件自动添加文件标签的方法及系统。
背景技术
文件管理是操作系统的五大职能之一,主要涉及文件的逻辑组织和物理组织,目录的结构和管理。所谓文件管理,就是操作系统中实现文件统一管理的一组软件、被管理的文件以及为实施文件管理所需要的一些数据结构的总称(是操作系统中负责存取和管理文件信息的机构)从系统角度来看,文件系统是对文件存储器的存储空间进行组织,分配和回收,负责文件的存储,检索,共享和保护。
现有的文件存储管理技术是以文件路径和文件名作为条件去判断文件的唯一性,进而实现文件的存储,同时需要手动为文件添加标签,未能实现文件多重信息的标签归类,不利于文件的分类管理和查找。比如:A文件夹中存储有:第一季度的财务报告、第一季度的生产报告、第一季度的安全报告等等,在B文件夹中存储有:第二季度的财务报告、第二季度的生产报告、第二季度的安全报告等等,如果用户要查看财务报告,就需要到每个文件夹去查找出来再集合到一块供用户使用。这种依靠文件路径和文件名的方式,使得文件查找和管理效率低下,尤其是数据庞大的时候,比如调取十年的财务报告。
发明内容
为了解决上述问题,本发明的目的在于提供一种根据文件特征码为文件自动添加文件标签的方法及系统,以优化文件分类管理和查找。
为了实现上述发明目的,本发明所采取的技术方案如下:
一种根据文件特征码为文件自动添加文件标签的方法,包括以下步骤:
根据第一文件的内容信息获得与所述第一文件内容一一对应的文件特征码信息;
根据第一文件的属性信息生成第一文件标签集合,所述第一文件标签集合中包括有多个文件标签;
在文件特征码数据存储系统中查找是否已经存在与所述第一文件相同的文件特征码信息,所述文件特征码数据存储系统包括一存储文件内容的文件内容存储单元、一存储文件特征码信息的文件特征码信息存储单元、以及一存储文件标签集合的文件标签集合存储单元,在所述文件特征码数据存储系统中同一文件的文件特征码信息、文件内容和文件标签集合具有一一对应绑定关系;
若已存在,则根据所述文件特征码信息在所述文件特征码数据存储系统中查找出与该文件特征码信息一一对应的第二文件标签集合,比对所述第一文件标签集合与第二文件标签集合,并将存在于所述第一文件标签集合中且不存在于第二文件标签集合中的文件标签信息添加到第二文件标签集合中;
若不存在,则将所述第一文件的文件特征码信息、文件内容和文件标签集合分别存储至所述文件特征码数据存储系统的文件特征码信息存储单元、文件内容存储单元和文件标签集合存储单元中。
进一步的,所述根据第一文件的内容信息获得与所述第一文件内容一一对应的文件特征码信息,具体是:根据第一文件内容信息采用散列算法计算获得与所述第一文件内容一一对应的文件特征码信息。
进一步的,所述散列算法为MD5算法或者SHA1算法。进一步的,所述文件特征码数据存储系统为数组与链表的集合、或者数据库。
一种根据文件特征码为文件自动添加文件标签的系统,包括以下模块:
文件特征码信息生成模块,用于根据第一文件的内容信息获得与所述第一文件内容一一对应的文件特征码信息;
文件标签集合生成模块,用于根据第一文件的属性信息生成第一文件标签集合,所述第一文件标签集合中包括有多个文件标签;
相同文件特征码查询模块,用于在文件特征码数据存储系统中查找是否已经存在与所述第一文件相同的文件特征码信息;若已存在,则执行文件标签集合更新模块;若不存在,则执行文件添加模块;所述文件特征码数据存储系统包括一存储文件内容的文件内容存储单元、一存储文件特征码信息的文件特征码信息存储单元、以及一存储文件标签集合的文件标签集合存储单元,在所述文件特征码数据存储系统中同一文件的文件特征码信息、文件内容和文件标签集合具有一一对应绑定关系;
文件标签集合更新模块,用于根据所述文件特征码信息在所述文件特征码数据存储系统中查找出与该文件特征码信息一一对应的第二文件标签集合,比对所述第一文件标签集合与第二文件标签集合,并将存在于所述第一文件标签集合中且不存在于第二文件标签集合中的文件标签信息添加到第二文件标签集合中;
文件添加模块,用于将所述第一文件的文件特征码信息、文件内容和文件标签集合分别存储至所述文件特征码数据存储系统的文件特征码信息存储单元、文件内容存储单元和文件标签集合存储单元中。
进一步的,所述文件特征码信息生成模块根据第一文件的内容信息获得与所述第一文件内容一一对应的文件特征码信息,具体是:根据第一文件内容信息采用散列算法计算获得与所述第一文件内容一一对应的文件特征码信息。
进一步的,所述散列算法为MD5算法或者SHA1算法。进一步的,所述文件特征码数据存储系统为数组与链表的集合、或者数据库。
本发明利用文件特征码算法为每一文件根据文件内容计算特征码,确定文件的唯一性,在此基础上为文件自动添加文件标签,实现文件、文件特征码、文件标签的绑定存储。进而利用同一文件的文件特征码信息、文件内容和文件标签集合具有一一对应绑定关系,实现文件的多重信息存储管理,可让使用者根据自己对文档文件已知的文件标签信息快速查找目标文件。
因此,采用本发明方法和系统,可实现文件的多重信息存储管理,提高文件的分类管理和查找效率。
附图说明
此附图说明所提供的图片用来辅助对本发明的进一步理解,构成本申请的一部分,并不构成对本发明的不当限定,在附图中:
图1是本发明方法的流程图;
图2是本发明系统对应的框图。
具体实施方式
如图1所示,本实施例公开了一种根据文件特征码为文件自动添加文件标签的方法,包括以下步骤:
(1)根据第一文件的内容信息获得与所述第一文件内容一一对应的文件特征码信息;本步骤的目的在于获取与文件内容唯一对应的文件特征码,文件特征码的计算方法可以采用现有散列算法,如MD5算法或者SHA1算法,两种算法都是根据文件内容计算获得所述文件特征码;本步骤所述的第一文件即是需要添加文件标签的文件,所述第一文件的内容信息是指存储在外部介质上的数据的集合,比如一个word文件,其中记录1万字的故事,那么这一万字就是文件内容信息;因为文件特征码具有唯一性,可以通过本步骤获得文件特征码唯一标识和查找文件,比如两个不同名称的文件,其文件内容是完全相同的,如果采用了文件特征码来标识它,就不会混乱,在管理时也可以避免同一文件放在不同目录或者应用不同名称重复存储占用存储空间,进而有利于优化文件存储管理;
(2)根据第一文件的属性信息生成第一文件标签集合,所述第一文件标签集合中包括有多个文件标签;所述第一文件的属性信息包括文件名、文件大小、文件创建时间、查看时间、文字数量、全文摘要等等,包括文件固有的属性信息和用户自定义的属性信息两部分,固有属性信息如页数、作者、标题、文件大小、文字数量、可自动总结的全文摘要等,自定义属性信息主要是指外界为文件添加的其他属性信息如操作系统记录的文件创建时间、操作系统记录的文件修改时间、操作系统记录的文件查看时间、操作系统记录的文件名、手动添加的作者名、手动添加的摘要、手动指定的关键词、手动标明的用途等;文件标签,就是与某个文件属性相对应的、用以表针文件特性的标签,比如文件页码数为A、文件作者为B的属性信息就对应生成“A”与“B”的文件标签;需要说明的是,文件标签与文件属性不是完全一一对应的关系,一个文件属性可以对应多个关联的标签项,例如一个文件于三个不同的时间段进行查阅,则文件查看时间这个属性即可对应三个关于文件查看时间的标签;所谓的文件标签集合,就是所有与文件属性对应的标签的集合;(3)在文件特征码数据存储系统中查找是否已经存在与所述第一文件相同的文件特征码信息,所述文件特征码数据存储系统包括一存储文件内容的文件内容存储单元、一存储文件特征码信息的文件特征码信息存储单元、以及一存储文件标签集合的文件标签集合存储单元,在所述文件特征码数据存储系统中同一文件的文件特征码信息、文件内容和文件标签集合具有一一对应绑定关系;本步骤实际是向文件特征码数据存储系统中添加第一文件前,看看文件特征码数据存储系统中是否已经存在第一文件,因为文件特征码是唯一标识文件的信息,所以通过判断文件特征码信息是否已经存在,就可以判断该文件是否存在;所述文件特征码数据存储系统为数组与链表的集合、或者数据库,就是用于存放数据的数据结构,可以是现有的关系数据库或其他非关系数据库,也可以是任何一种可以存储信息的数据结构的软件实现,比如一个多维数组、链表,都算数据存储系统;若已存在,则执行第(41)步;若不存在,则执行第(42)步;
(41)根据所述文件特征码信息在所述文件特征码数据存储系统中查找出与该文件特征码信息一一对应的第二文件标签集合,比对所述第一文件标签集合与第二文件标签集合,并将存在于所述第一文件标签集合中且不存在于第二文件标签集合中的文件标签信息添加到第二文件标签集合中;本步骤是在文件特征码数据存储系统中已经存储有该文件的情况下,检测其文件标签是不是有更新,如果有新的标签内容产生就把新产生的文件标签添加到原来的标签集合中去,以更加丰富的记载文件属性信息,以便于分类管理;
(42)将所述第一文件的文件特征码信息、文件内容和文件标签集合分别存储至所述文件特征码数据存储系统的文件特征码信息存储单元、文件内容存储单元和文件标签集合存储单元中;本步骤就是将文件特征码数据存储系统中不存在的文件的相关信息都存储在其中,以便于管理查找。
本实施例还公开了一种与前述方法完全对应的根据文件特征码为文件自动添加文件标签的系统,包括以下模块:
文件特征码信息生成模块1,用于根据第一文件的内容信息获得与所述第一文件内容一一对应的文件特征码信息,具体可是根据第一文件内容信息采用散列算法计算获得与所述第一文件内容一一对应的文件特征码信息,所述散列算法为MD5算法或者SHA1算法。
文件标签集合生成模块2,用于根据第一文件的属性信息生成第一文件标签集合,所述第一文件标签集合中包括有多个文件标签;
相同文件特征码查询模块3,用于在文件特征码数据存储系统中查找是否已经存在与所述第一文件相同的文件特征码信息;若已存在,则执行文件标签集合更新模块4;若不存在,则执行文件添加模块5;所述文件特征码数据存储系统包括一存储文件内容的文件内容存储单元、一存储文件特征码信息的文件特征码信息存储单元、以及一存储文件标签集合的文件标签集合存储单元,在所述文件特征码数据存储系统中同一文件的文件特征码信息、文件内容和文件标签集合具有一一对应绑定关系;所述文件特征码数据存储系统为数组与链表的集合、或者数据库;
文件标签集合更新模块4,用于根据所述文件特征码信息在所述文件特征码数据存储系统中查找出与该文件特征码信息一一对应的第二文件标签集合,比对所述第一文件标签集合与第二文件标签集合,并将存在于所述第一文件标签集合中且不存在于第二文件标签集合中的文件标签信息添加到第二文件标签集合中;
文件添加模块5,用于将所述第一文件的文件特征码信息、文件内容和文件标签集合分别存储至所述文件特征码数据存储系统的文件特征码信息存储单元、文件内容存储单元和文件标签集合存储单元中。
本发明提出一种根据文件特征码为文件自动添加文件标签的方法,通过文件特征码算法为每一个文件的内容计算特定的文件特征码,以此作为条件判断文件的唯一性,并根据文件属性信息自动为文件生成文件标签,在数据存储系统中实现文件、文件特征码与文件标签的绑定存储,此外,保持文件标签信息的更新存储,从而实现文件多重信息类别的存储管理。
比如:A文件夹中存储有:第一季度的财务报告、第一季度的生产报告、第一季度的安全报告等等,在B文件夹中存储有:第二季度的财务报告、第二季度的生产报告、第二季度的安全报告等等。通过以上实施例公开的方法或系统可以为A文件夹中的第一季度的财务报告、第一季度的生产报告、第一季度的安全报告分别生成一个标签集合,包括多个文件标签:存储路径、名称、创建时间等等;为B文件夹中的第二季度的财务报告、第二季度的生产报告、第二季度的安全报告分别生成一个标签集合,包括多个文件标签:存储路径、名称、创建时间等等。那么在查找和管理文件时,就不再单纯的利用文件存储路径和文件名来管理文件,可以利用文件的所有属性来管理文件;比如用户要查找财务报告,就可以快速地在各个文件标签集合中查找出具有文件标签为财务报告的文件出来,从而提高其分类管理效率。
以上详细描述了本发明的较佳具体实施例,应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依本发明构思在现有技术基础上通过逻辑分析、推理或者根据有限的实验可以得到的技术方案,均应该在由本权利要求书所确定的保护范围之中。

Claims (8)

1.一种根据文件特征码为文件自动添加文件标签的方法,其特征在于包括以下步骤:
根据第一文件的内容信息获得与所述第一文件内容一一对应的文件特征码信息;
根据第一文件的属性信息生成第一文件标签集合,所述第一文件标签集合中包括有多个文件标签;
在文件特征码数据存储系统中查找是否已经存在与所述第一文件相同的文件特征码信息,所述文件特征码数据存储系统包括一存储文件内容的文件内容存储单元、一存储文件特征码信息的文件特征码信息存储单元、以及一存储文件标签集合的文件标签集合存储单元,在所述文件特征码数据存储系统中同一文件的文件特征码信息、文件内容和文件标签集合具有一一对应绑定关系;
若已存在,则根据所述文件特征码信息在所述文件特征码数据存储系统中查找出与该文件特征码信息一一对应的第二文件标签集合,比对所述第一文件标签集合与第二文件标签集合,并将存在于所述第一文件标签集合中且不存在于第二文件标签集合中的文件标签信息添加到第二文件标签集合中;
若不存在,则将所述第一文件的文件特征码信息、文件内容和文件标签集合分别存储至所述文件特征码数据存储系统的文件特征码信息存储单元、文件内容存储单元和文件标签集合存储单元中。
2.根据权利要求1所述的根据文件特征码为文件自动添加文件标签的方法,其特征在于:
所述根据第一文件的内容信息获得与所述第一文件内容一一对应的文件特征码信息,具体是:根据第一文件内容信息采用散列算法计算获得与所述第一文件内容一一对应的文件特征码信息。
3.根据权利要求2所述的根据文件特征码为文件自动添加文件标签的方法,其特征在于:
所述散列算法为MD5算法或者SHA1算法。
4.根据权利要求1-3任一项所述的根据文件特征码为文件自动添加文件标签的方法,其特征在于:
所述文件特征码数据存储系统为数组与链表的集合、或者数据库。
5.一种根据文件特征码为文件自动添加文件标签的系统,其特征在于包括以下模块:
文件特征码信息生成模块,用于根据第一文件的内容信息获得与所述第一文件内容一一对应的文件特征码信息;
文件标签集合生成模块,用于根据第一文件的属性信息生成第一文件标签集合,所述第一文件标签集合中包括有多个文件标签;
相同文件特征码查询模块,用于在文件特征码数据存储系统中查找是否已经存在与所述第一文件相同的文件特征码信息;若已存在,则执行文件标签集合更新模块;若不存在,则执行文件添加模块;所述文件特征码数据存储系统包括一存储文件内容的文件内容存储单元、一存储文件特征码信息的文件特征码信息存储单元、以及一存储文件标签集合的文件标签集合存储单元,在所述文件特征码数据存储系统中同一文件的文件特征码信息、文件内容和文件标签集合具有一一对应绑定关系;
文件标签集合更新模块,用于根据所述文件特征码信息在所述文件特征码数据存储系统中查找出与该文件特征码信息一一对应的第二文件标签集合,比对所述第一文件标签集合与第二文件标签集合,并将存在于所述第一文件标签集合中且不存在于第二文件标签集合中的文件标签信息添加到第二文件标签集合中;
文件添加模块,用于将所述第一文件的文件特征码信息、文件内容和文件标签集合分别存储至所述文件特征码数据存储系统的文件特征码信息存储单元、文件内容存储单元和文件标签集合存储单元中。
6.根据权利要求5所述的根据文件特征码为文件自动添加文件标签的系统,其特征在于:
所述文件特征码信息生成模块根据第一文件的内容信息获得与所述第一文件内容一一对应的文件特征码信息,具体是:根据第一文件内容信息采用散列算法计算获得与所述第一文件内容一一对应的文件特征码信息。
7.根据权利要求6所述的根据文件特征码为文件自动添加文件标签的系统,其特征在于:
所述散列算法为MD5算法或者SHA1算法。
8.根据权利要求5-7任一项所述的根据文件特征码为文件自动添加文件标签的系统,其特征在于:
所述文件特征码数据存储系统为数组与链表的集合、或者数据库。
CN201210590511.4A 2012-12-29 2012-12-29 根据文件特征码为文件自动添加文件标签的方法及系统 Active CN102999637B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210590511.4A CN102999637B (zh) 2012-12-29 2012-12-29 根据文件特征码为文件自动添加文件标签的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210590511.4A CN102999637B (zh) 2012-12-29 2012-12-29 根据文件特征码为文件自动添加文件标签的方法及系统

Publications (2)

Publication Number Publication Date
CN102999637A true CN102999637A (zh) 2013-03-27
CN102999637B CN102999637B (zh) 2015-11-18

Family

ID=47928203

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210590511.4A Active CN102999637B (zh) 2012-12-29 2012-12-29 根据文件特征码为文件自动添加文件标签的方法及系统

Country Status (1)

Country Link
CN (1) CN102999637B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104077385A (zh) * 2014-06-27 2014-10-01 北京海泰方圆科技有限公司 一种文件的分类及检索方法
CN104699839A (zh) * 2015-03-31 2015-06-10 北京奇艺世纪科技有限公司 一种文件查找方法及装置
CN106326291A (zh) * 2015-07-01 2017-01-11 羊剑 一种基于标签的需求引导配对方法及其系统
CN108563747A (zh) * 2018-04-13 2018-09-21 北京深度智耀科技有限公司 一种文档处理方法及装置
CN109254949A (zh) * 2018-07-18 2019-01-22 北京深度智耀科技有限公司 一种文档处理的方法及装置
CN110941586A (zh) * 2019-10-25 2020-03-31 深圳市毕美科技有限公司 一种工程设计数据管理方法及系统
CN111858486A (zh) * 2020-07-03 2020-10-30 北京天空卫士网络安全技术有限公司 一种文件分类方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110246433A1 (en) * 2010-03-31 2011-10-06 Xerox Corporation. Random number based data integrity verification method and system for distributed cloud storage
CN102222074A (zh) * 2010-04-16 2011-10-19 腾讯科技(深圳)有限公司 在线歌词数据匹配的方法、装置及后台数据装置
CN102402542A (zh) * 2010-09-14 2012-04-04 腾讯科技(深圳)有限公司 一种视频标签方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110246433A1 (en) * 2010-03-31 2011-10-06 Xerox Corporation. Random number based data integrity verification method and system for distributed cloud storage
CN102222074A (zh) * 2010-04-16 2011-10-19 腾讯科技(深圳)有限公司 在线歌词数据匹配的方法、装置及后台数据装置
CN102402542A (zh) * 2010-09-14 2012-04-04 腾讯科技(深圳)有限公司 一种视频标签方法及系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104077385A (zh) * 2014-06-27 2014-10-01 北京海泰方圆科技有限公司 一种文件的分类及检索方法
CN104699839A (zh) * 2015-03-31 2015-06-10 北京奇艺世纪科技有限公司 一种文件查找方法及装置
CN106326291A (zh) * 2015-07-01 2017-01-11 羊剑 一种基于标签的需求引导配对方法及其系统
CN108563747A (zh) * 2018-04-13 2018-09-21 北京深度智耀科技有限公司 一种文档处理方法及装置
US10909187B2 (en) 2018-04-13 2021-02-02 Beijing Deep Intelligent Pharma Co., Ltd. Document processing method and device
CN109254949A (zh) * 2018-07-18 2019-01-22 北京深度智耀科技有限公司 一种文档处理的方法及装置
CN110941586A (zh) * 2019-10-25 2020-03-31 深圳市毕美科技有限公司 一种工程设计数据管理方法及系统
CN111858486A (zh) * 2020-07-03 2020-10-30 北京天空卫士网络安全技术有限公司 一种文件分类方法和装置

Also Published As

Publication number Publication date
CN102999637B (zh) 2015-11-18

Similar Documents

Publication Publication Date Title
CN102999637B (zh) 根据文件特征码为文件自动添加文件标签的方法及系统
Ben-Yitzhak et al. Beyond basic faceted search
CN103412917B (zh) 一种可扩展的多类型领域数据协调管理的数据库系统和管理方法
US8108411B2 (en) Methods and systems for merging data sets
CN102163218A (zh) 基于图索引的图数据库关键词邻近搜索方法
Zou et al. Ctree: a compact tree for indexing XML data
CN107491487A (zh) 一种全文数据库架构及位图索引创建、数据查询方法、服务器及介质
CN102270225A (zh) 数据变更日志监控方法和数据变更日志监控装置
CN102169491B (zh) 一种多数据集中重复记录动态检测方法
CN112000851B (zh) 一种键值模型、文档模型和图模型数据的统一存储方法
CN105117442A (zh) 一种基于概率的大数据查询方法
CN101963993B (zh) 一种数据库单表记录快速查找的方法
CN101266607A (zh) 基于最大间隙空间映射的高维数据索引方法
CN108984626A (zh) 一种数据处理方法、装置及服务器
US11144580B1 (en) Columnar storage and processing of unstructured data
Li et al. Answering why-not questions on top-k augmented spatial keyword queries
CN102597969A (zh) 带属性的键值存储的数据库管理装置及其键值存储结构的高速缓存装置
Klaib et al. Investigation into indexing XML data techniques
Hsu et al. UCIS-X: an updatable compact indexing scheme for efficient extensible markup language document updating and query evaluation
Gao et al. Top-k interesting phrase mining in ad-hoc collections using sequence pattern indexing
CN114911826A (zh) 一种关联数据检索方法和系统
Zeng et al. Efficient xml keyword search: from graph model to tree model
Zhang et al. Storing fuzzy description logic ontology knowledge bases in fuzzy relational databases
Kwon et al. G-Index Model: A generic model of index schemes for top-k spatial-keyword queries
Zhong et al. 3SEPIAS: A semi-structured search engine for personal information in dataspace system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: Jinshan software building No. 8 Jingshan Hill Road, Lane 519015 Lianshan Jida Zhuhai city in Guangdong Province

Patentee after: Zhuhai Kingsoft Office Software Co., Ltd.

Patentee after: Beijing Kingsoft office software Limited by Share Ltd

Address before: Jinshan software building No. 8 Jingshan Hill Road, Lane 519015 Lianshan Jida Zhuhai city in Guangdong Province

Patentee before: Zhuhai Kingsoft Office Software Co., Ltd.

Patentee before: Beijing Kingsoft WPS Office Co., Ltd.