CN114443800A - 基于国产cpu和os的电子文档检索及权限控制系统及方法 - Google Patents
基于国产cpu和os的电子文档检索及权限控制系统及方法 Download PDFInfo
- Publication number
- CN114443800A CN114443800A CN202210012666.3A CN202210012666A CN114443800A CN 114443800 A CN114443800 A CN 114443800A CN 202210012666 A CN202210012666 A CN 202210012666A CN 114443800 A CN114443800 A CN 114443800A
- Authority
- CN
- China
- Prior art keywords
- data
- electronic document
- document
- user
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 17
- 238000004140 cleaning Methods 0.000 claims abstract description 12
- 238000012216 screening Methods 0.000 claims abstract description 12
- 238000000605 extraction Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 8
- 230000011218 segmentation Effects 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 6
- 238000002360 preparation method Methods 0.000 claims description 3
- 238000003860 storage Methods 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 238000009826 distribution Methods 0.000 claims description 2
- 238000001914 filtration Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 claims description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Computational Linguistics (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Storage Device Security (AREA)
Abstract
本发明公开一种基于国产CPU和OS的电子文档检索及权限控制系统及方法,涉及大数据技术领域,其实现包括:读取电子公文文档,并提取文档的唯一标识、衍生信息和包含的文字信息,作为全文搜索的数据源;对提取的文字信息进行清洗、筛选,形成索引目录库,同时接收用户输入的搜索关键词,以匹配索引目录库中的索引目录,进而返回索引地址、唯一标识和衍生信息;基于登录用户的角色赋予操作权限和数据权限,从而控制复制、下载、打印功能,控制用户有权查看的数据范围;根据返回的索引地址精确匹配到文档所在的位置信息,返回文档目录列表。本发明可以实现所查找文档的快速定位,同时,基于权限管理的控制,划定数据的展示范围,确保数据的安全性。
Description
技术领域
本发明涉及大数据技术领域,具体的说是一种基于国产CPU和OS的电子文档检索及权限控制系统及方法。
背景技术
面对目前严峻的国际信息安全态势,我国正逐步加强信息安全防护的建设,信息安全正在逐步成为国家的重要安全战略。随着我国科研技术水平的提高和大量科研力量的投入,硬件水平持续发展,出现了龙芯、飞腾、鲲鹏等一批完全具有自主知识产权的国产芯片,与之配套的软件产品,例如国产操作系统中标麒麟、统信UOS,国产数据库神通、金仓、达梦,国产中间件东方通、金蝶,国产办公软件中标Office、金山WPS、福昕版式阅读器、数科版式阅读器等应运而生,丰富完善国产软件生态系统。
在此大背景下,基于国产环境下的电子公文系统已在政府等部门率先使用,电子公文系统中会生产大量的电子公文文档,涉及wps、et、ofd等各种格式的文档,由此造成用户在海量的数据中根据内容查找需要的文档时极为的费时、费力。同时,考虑到系统的数据安全性问题,部分电子公文文档只能在一定范围内公开或者涉密等级较高,需要保证既能快速准确的查找到需要的数据,又要兼顾数据的安全性问题。
发明内容
本发明针对目前技术发展的需求和不足之处,提供一种基于国产CPU和OS的电子文档检索及权限控制系统及方法。
首先,本发明提供一种基于国产CPU和OS的电子文档检索及权限控制系统,解决上述技术问题采用的技术方案如下:
一种基于国产CPU和OS的电子文档检索及权限控制系统,其结构包括:
文字提取模块,用于读取电子公文文档,并提取文档的唯一标识、衍生信息和包含的文字信息,作为全文搜索的数据源;
搜索引擎模块,用于对文字提取模块提取的文字信息进行清洗、筛选,形成索引目录库,还用于接收用户输入的搜索关键词,以匹配索引目录库中的索引目录,进而返回索引地址、唯一标识和衍生信息;
权限管理模块,用于基于登录用户的角色赋予操作权限和数据权限,从而控制复制、下载、打印功能,控制用户有权查看的数据范围;
数据展示模块,用于根据搜索引擎模块返回的索引地址精确匹配到文档所在的位置信息,进而返回电子公文文档目录列表。
可选的,所涉及文字提取模块具体包括:
文档接收单元,用于接收电子公文文档;
提取文字单元,用于提取所接收电子公文文档的唯一标识、衍生信息和包含的文字信息,所述衍生信息包含密级、起草人、起草部门、审批人;
保存文字单元,用于保存提取文字单元提取的唯一标识、衍生信息和文字信息。
进一步可选的,所涉及搜索引擎模块具体包括:
文档处理单元,用于接收文字提取模块提取的唯一标识和文字信息,并利用分词组件对文字信息进行分词,将文字信息切分成一个个单独的单词,然后进行单词的清洗、筛选、去标点符号、去停用词,形成关键词组,将关键词组作为索引目录,存储到索引目录库,同时,将该关键词组所属电子公文文档的唯一标识和衍生信息存储到索引目录库,建立电子公文文档唯一标识和关键词组的映射关系;
检索单元,用于接收用户输入的搜索关键词,并到索引目录库中进行关键词组的匹配,根据匹配结果得到电子公文文档的索引地址、唯一标识和衍生信息。
进一步可选的,所涉及权限管理模块具体包括:
用户管理单元,用于对用户组或单个用户进行管理;
角色管理单元,用于定义用户组或单个用户的角色,并基于定义的角色进行权限分配;
权限设置单元,用于设置用户组或单个用户所属不同角色时的操作权限和数据权限,所述操作权限进一步包括用户组或单个用户所属不同角色时的复制、下载、打印权限,所述数据权限进一步包括用户组或单个用户所属不同角色时有权查看电子公文文档的数据范围;
数据处理模块,用于接收搜索引擎模块返回的索引地址、唯一标识和衍生信息,并根据当前用户所属的角色进行权限验证,过滤掉权限范围外的数据,传送至数据展示模块。
进一步可选的,所涉及数据展示模块和所述搜索引擎模块通过UI页面与用户进行交互;
用户通过UI页面输入搜索关键词后,UI页面对数据展示模块接收的数据进行组装和展示,用户通过UI页面即可查看与输入信息相对应的电子公文文档目录列表。
其次,本发明提供一种基于国产CPU和OS的电子文档检索及权限控制方法,解决上述技术问题采用的技术方案如下:
一种基于国产CPU和OS的电子文档检索及权限控制方法,其实现内容包括:
(一)准备阶段:
读取电子公文文档,并提取文档的唯一标识、衍生信息和包含的文字信息,作为全文搜索的数据源,所述衍生信息包含密级、起草人、起草部门、审批人;
对提取的文字信息进行清洗、筛选,形成关键词组,将关键词组作为索引目录,存储到索引目录库,同时,将该关键词组所属电子公文文档的唯一标识和衍生信息存储到索引目录库,建立电子公文文档唯一标识和关键词组的映射关系;
定义用户组或单个用户的角色,设置不同角色对电子公文文档的操作权限和数据权限;
(二)查看阶段:
用户组或单个用户以不同的角色登录索引目录库,随后通过UI页面输入搜索关键词,UI页面基于该关键词匹配索引目录库中的索引目录,得到与输入信息相对应的电子公文文档目录列表,点击电子公文文档目录即可进行该文档中有权限内容的展示。
可选的,对提取的文字信息进行清洗、筛选,形成关键词组,具体流程包括:
利用分词组件对提取的文字信息进行分词,将文字信息切分成一个个单独的单词,然后进行单词的清洗、筛选、去标点符号、去停用词,形成关键词组。
可选的,可以对用户组或单个用户定义多个不同的角色;
基于电子公文文档的衍生信息,设置不同角色对电子公文文档的操作权限和数据权限。
进一步可选的,通过设置角色对电子公文文档的操作权限,可以控制用户组或单个用户对电子公文文档的复制、下载、打印;
通过设置角色对电子公文文档的数据权限,可以控制用户组或单个用户有权查看电子公文文档的数据范围。
本发明的一种基于国产CPU和OS的电子文档检索及权限控制系统及方法,与现有技术相比具有的有益效果是:
(1)本发明有利于用户从大量电子公文文档中,快速定位到所需文档的位置,显著降低用户的查找难度和节省查找的时间,同时权限管理控制的使用,划定了数据信息的展示范围,确保了数据的安全性,避免了敏感数据的泄露;
(2)本发明既能有效的解决大量电子文档检索难度大、耗费时间长的问题,显著的提升检索效率,提高用户的体验度,又能保护电子公文文档的安全性,控制数据的传播范围,避免造成不当范围内的数据公开和敏感数据的泄露。
附图说明
附图1是本发明实施例一的连接框图。
附图中各标号信息表示:
10、文字提取模块,20、搜索引擎模块,30、权限管理模块,
40、数据展示模块,50、UI页面;
11、文档接收单元,12、提取文字单元,13、保存文字单元;
21、文档处理单元,22、检索单元,23、索引目录库;
31、用户管理单元,32、角色管理单元,33、权限设置单元,34、数据处理模块。
具体实施方式
为使本发明的技术方案、解决的技术问题和技术效果更加清楚明白,以下结合具体实施例,对本发明的技术方案进行清楚、完整的描述。
实施例一:
结合附图1,本实施例提出一种基于国产CPU和OS的电子文档检索及权限控制系统,其结构包括:
文字提取模块10,用于读取电子公文文档,并提取文档的唯一标识、衍生信息和包含的文字信息,作为全文搜索的数据源;
搜索引擎模块20,用于对文字提取模块提取的文字信息进行清洗、筛选,形成索引目录库23,还用于接收用户输入的搜索关键词,以匹配索引目录库23中的索引目录,进而返回索引地址、唯一标识和衍生信息;
权限管理模块30,用于基于登录用户的角色赋予操作权限和数据权限,从而控制复制、下载、打印功能,控制用户有权查看的数据范围;
数据展示模块40,用于根据搜索引擎模块返回的索引地址精确匹配到文档所在的位置信息,进而返回电子公文文档目录列表。
本实施例中,文字提取模块10具体包括:
文档接收单元11,用于接收电子公文文档;
提取文字单元12,用于提取所接收电子公文文档的唯一标识、衍生信息和包含的文字信息,所述衍生信息包含密级、起草人、起草部门、审批人;
保存文字单元13,用于保存提取文字单元提取的唯一标识、衍生信息和文字信息。
本实施例中,搜索引擎模块20具体包括:
文档处理单元21,用于接收文字提取模块10提取的唯一标识和文字信息,并利用分词组件对文字信息进行分词,将文字信息切分成一个个单独的单词,然后进行单词的清洗、筛选、去标点符号、去停用词,形成关键词组,将关键词组作为索引目录,存储到索引目录库23,同时,将该关键词组所属电子公文文档的唯一标识和衍生信息存储到索引目录库23,建立电子公文文档唯一标识和关键词组的映射关系;
检索单元22,用于接收用户输入的搜索关键词,并到索引目录库23中进行关键词组的匹配,根据匹配结果得到电子公文文档的索引地址、唯一标识和衍生信息。
本实施例中,权限管理模块30具体包括:
用户管理单元31,用于对用户组或单个用户进行管理;
角色管理单元32,用于定义用户组或单个用户的角色,并基于定义的角色进行权限分配;
权限设置单元33,用于设置用户组或单个用户所属不同角色时的操作权限和数据权限,所述操作权限进一步包括用户组或单个用户所属不同角色时的复制、下载、打印权限,所述数据权限进一步包括用户组或单个用户所属不同角色时有权查看电子公文文档的数据范围;
数据处理模块34,用于接收搜索引擎模块20返回的索引地址、唯一标识和衍生信息,并根据当前用户所属的角色进行权限验证,过滤掉权限范围外的数据,传送至数据展示模块40。
本实施例中,数据展示模块40和搜索引擎模块20通过UI页面50与用户进行交互;
用户通过UI页面50输入搜索关键词后,UI页面50对数据展示模块40接收的数据进行组装和展示,用户通过UI页面50即可查看与输入信息相对应的电子公文文档目录列表。
实施例二:
本实施例提出一种基于国产CPU和OS的电子文档检索及权限控制方法,其实现内容包括:
(一)准备阶段:
(1.1)读取电子公文文档,并提取文档的唯一标识、衍生信息和包含的文字信息,作为全文搜索的数据源,所述衍生信息包含密级、起草人、起草部门、审批人。
(1.2)对提取的文字信息进行清洗、筛选,利用分词组件对提取的文字信息进行分词,将文字信息切分成一个个单独的单词,然后进行单词的清洗、筛选、去标点符号、去停用词,形成关键词组,将关键词组作为索引目录,存储到索引目录库,同时,将该关键词组所属电子公文文档的唯一标识和衍生信息存储到索引目录库,建立电子公文文档唯一标识和关键词组的映射关系。
(1.3)定义用户组或单个用户的角色,设置不同角色对电子公文文档的操作权限和数据权限。
可以对用户组或单个用户定义多个不同的角色。基于电子公文文档的衍生信息,设置不同角色对电子公文文档的操作权限和数据权限。
通过设置角色对电子公文文档的操作权限,可以控制用户组或单个用户对电子公文文档的复制、下载、打印。
通过设置角色对电子公文文档的数据权限,可以控制用户组或单个用户有权查看电子公文文档的数据范围。
(二)查看阶段:
用户组或单个用户以不同的角色登录索引目录库,随后通过UI页面输入搜索关键词,UI页面基于该关键词匹配索引目录库中的索引目录,得到与输入信息相对应的电子公文文档目录列表,点击电子公文文档目录即可进行该文档中有权限内容的展示。
综上可知,采用本发明的一种基于国产CPU和OS的电子文档检索及权限控制系统及方法,可以帮助用户快速定位到所需文档的位置,降低用户的查找难度,节省查找的时间,解决了大量电子文档检索难度大、耗费时间长的问题,同时,权限管理控制的使用,划定了数据信息的展示范围,确保了数据的安全性,避免了敏感数据的泄露。
以上应用具体个例对本发明的原理及实施方式进行了详细阐述,这些实施例只是用于帮助理解本发明的核心技术内容。基于本发明的上述具体实施例,本技术领域的技术人员在不脱离本发明原理的前提下,对本发明所作出的任何改进和修饰,皆应落入本发明的专利保护范围。
Claims (9)
1.一种基于国产CPU和OS的电子文档检索及权限控制系统,其特征在于,其结构包括:
文字提取模块,用于读取电子公文文档,并提取文档的唯一标识、衍生信息和包含的文字信息,作为全文搜索的数据源;
搜索引擎模块,用于对文字提取模块提取的文字信息进行清洗、筛选,形成索引目录库,还用于接收用户输入的搜索关键词,以匹配索引目录库中的索引目录,进而返回索引地址、唯一标识和衍生信息;
权限管理模块,用于基于登录用户的角色赋予操作权限和数据权限,从而控制复制、下载、打印功能,控制用户有权查看的数据范围;
数据展示模块,用于根据搜索引擎模块返回的索引地址精确匹配到文档所在的位置信息,进而返回电子公文文档目录列表。
2.根据权利要求1所述的基于国产CPU和OS的电子文档检索及权限控制系统,其特征在于,所述文字提取模块具体包括:
文档接收单元,用于接收电子公文文档;
提取文字单元,用于提取所接收电子公文文档的唯一标识、衍生信息和包含的文字信息,所述衍生信息包含密级、起草人、起草部门、审批人;
保存文字单元,用于保存提取文字单元提取的唯一标识、衍生信息和文字信息。
3.根据权利要求2所述的基于国产CPU和OS的电子文档检索及权限控制系统,其特征在于,所述搜索引擎模块具体包括:
文档处理单元,用于接收文字提取模块提取的唯一标识和文字信息,并利用分词组件对文字信息进行分词,将文字信息切分成一个个单独的单词,然后进行单词的清洗、筛选、去标点符号、去停用词,形成关键词组,将关键词组作为索引目录,存储到索引目录库,同时,将该关键词组所属电子公文文档的唯一标识和衍生信息存储到索引目录库,建立电子公文文档唯一标识和关键词组的映射关系;
检索单元,用于接收用户输入的搜索关键词,并到索引目录库中进行关键词组的匹配,根据匹配结果得到电子公文文档的索引地址、唯一标识和衍生信息。
4.根据权利要求3所述的基于国产CPU和OS的电子文档检索及权限控制系统,其特征在于,所述权限管理模块具体包括:
用户管理单元,用于对用户组或单个用户进行管理;
角色管理单元,用于定义用户组或单个用户的角色,并基于定义的角色进行权限分配;
权限设置单元,用于设置用户组或单个用户所属不同角色时的操作权限和数据权限,所述操作权限进一步包括用户组或单个用户所属不同角色时的复制、下载、打印权限,所述数据权限进一步包括用户组或单个用户所属不同角色时有权查看电子公文文档的数据范围;
数据处理模块,用于接收搜索引擎模块返回的索引地址、唯一标识和衍生信息,并根据当前用户所属的角色进行权限验证,过滤掉权限范围外的数据,传送至数据展示模块。
5.根据权利要求4所述的基于国产CPU和OS的电子文档检索及权限控制系统,其特征在于,所述数据展示模块和所述搜索引擎模块通过UI页面与用户进行交互;
用户通过UI页面输入搜索关键词后,UI页面对数据展示模块接收的数据进行组装和展示,用户通过UI页面即可查看与输入信息相对应的电子公文文档目录列表。
6.一种基于国产CPU和OS的电子文档检索及权限控制方法,其特征在于,其实现内容包括:
(一)准备阶段:
读取电子公文文档,并提取文档的唯一标识、衍生信息和包含的文字信息,作为全文搜索的数据源,所述衍生信息包含密级、起草人、起草部门、审批人;
对提取的文字信息进行清洗、筛选,形成关键词组,将关键词组作为索引目录,存储到索引目录库,同时,将该关键词组所属电子公文文档的唯一标识和衍生信息存储到索引目录库,建立电子公文文档唯一标识和关键词组的映射关系;
定义用户组或单个用户的角色,设置不同角色对电子公文文档的操作权限和数据权限;
(二)查看阶段:
用户组或单个用户以不同的角色登录索引目录库,随后通过UI页面输入搜索关键词,UI页面基于该关键词匹配索引目录库中的索引目录,得到与输入信息相对应的电子公文文档目录列表,点击电子公文文档目录即可进行该文档中有权限内容的展示。
7.根据权利要求6所述的基于国产CPU和OS的电子文档检索及权限控制方法,其特征在于,对提取的文字信息进行清洗、筛选,形成关键词组,具体流程包括:
利用分词组件对提取的文字信息进行分词,将文字信息切分成一个个单独的单词,然后进行单词的清洗、筛选、去标点符号、去停用词,形成关键词组。
8.根据权利要求7所述的基于国产CPU和OS的电子文档检索及权限控制方法,其特征在于,可以对用户组或单个用户定义多个不同的角色;
基于电子公文文档的衍生信息,设置不同角色对电子公文文档的操作权限和数据权限。
9.根据权利要求8所述的基于国产CPU和OS的电子文档检索及权限控制方法,其特征在于,通过设置角色对电子公文文档的操作权限,可以控制用户组或单个用户对电子公文文档的复制、下载、打印;
通过设置角色对电子公文文档的数据权限,可以控制用户组或单个用户有权查看电子公文文档的数据范围。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210012666.3A CN114443800A (zh) | 2022-01-06 | 2022-01-06 | 基于国产cpu和os的电子文档检索及权限控制系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210012666.3A CN114443800A (zh) | 2022-01-06 | 2022-01-06 | 基于国产cpu和os的电子文档检索及权限控制系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114443800A true CN114443800A (zh) | 2022-05-06 |
Family
ID=81368577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210012666.3A Pending CN114443800A (zh) | 2022-01-06 | 2022-01-06 | 基于国产cpu和os的电子文档检索及权限控制系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114443800A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116719785A (zh) * | 2023-08-09 | 2023-09-08 | 北京量子伟业信息技术股份有限公司 | 一种基于元数据的数据库管理系统 |
CN117408652A (zh) * | 2023-12-15 | 2024-01-16 | 江西驱动交通科技有限公司 | 一种档案数据分析管理方法及系统 |
-
2022
- 2022-01-06 CN CN202210012666.3A patent/CN114443800A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116719785A (zh) * | 2023-08-09 | 2023-09-08 | 北京量子伟业信息技术股份有限公司 | 一种基于元数据的数据库管理系统 |
CN117408652A (zh) * | 2023-12-15 | 2024-01-16 | 江西驱动交通科技有限公司 | 一种档案数据分析管理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10073875B2 (en) | System and method of search indexes using key-value attributes to searchable metadata | |
CN114443800A (zh) | 基于国产cpu和os的电子文档检索及权限控制系统及方法 | |
US7685106B2 (en) | Sharing of full text index entries across application boundaries | |
CN111259006A (zh) | 一种通用的分布式异构数据一体化物理汇聚、组织、发布与服务方法及系统 | |
US20100325102A1 (en) | System and method for managing electronic documents in a litigation context | |
US20070094300A1 (en) | Virtual repository management | |
US11669576B2 (en) | System, method and computer program product for protecting derived metadata when updating records within a search engine | |
CN102012896B (zh) | 一种实现文件内容批量修改的方法和装置 | |
CN103678556A (zh) | 列式数据库处理的方法和处理设备 | |
WO2006036487A2 (en) | System and method for management of data repositories | |
CN101539904A (zh) | 一种引文自动标引方法 | |
CN112052749A (zh) | 档案的归档方法、装置、电子设备及计算机可读存储介质 | |
CN104035993B (zh) | 电子书的存储检索方法、电子书管理系统、阅读系统 | |
US20060277169A1 (en) | Using the quantity of electronically readable text to generate a derivative attribute for an electronic file | |
CN102591475A (zh) | 一种在线编辑器的内容输入方法及系统 | |
WO2019171190A1 (en) | System and method for searching based on text blocks and associated search operators | |
CN111460099A (zh) | 关键词提取方法、装置及存储介质 | |
CN102262633B (zh) | 一种面向全文检索的结构化数据安全检索方法 | |
CN102103612A (zh) | 一种信息提取方法及装置 | |
CN113704406B (zh) | 一种流行缩略语的中文释义匹配系统与方法 | |
CN114065719A (zh) | 文档处理方法及其装置、电子设备、计算机可读存储介质 | |
Ilic et al. | Inverted index search in data mining | |
CN102591878A (zh) | 技术标准的数字化处理方法 | |
CN115146030A (zh) | 一种基于知识图谱的公务文书写作方法及系统 | |
US20070198594A1 (en) | Transferring electronic file constituents contained in an electronic compound file using a forensic file copy |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |