CN116702704A - 一种文档协作的信息标记系统及方法 - Google Patents
一种文档协作的信息标记系统及方法 Download PDFInfo
- Publication number
- CN116702704A CN116702704A CN202310960596.9A CN202310960596A CN116702704A CN 116702704 A CN116702704 A CN 116702704A CN 202310960596 A CN202310960596 A CN 202310960596A CN 116702704 A CN116702704 A CN 116702704A
- Authority
- CN
- China
- Prior art keywords
- information
- unit
- document
- marking
- functional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000013139 quantization Methods 0.000 claims abstract description 55
- 238000004364 calculation method Methods 0.000 claims abstract description 24
- 238000007726 management method Methods 0.000 claims description 73
- 238000012545 processing Methods 0.000 claims description 21
- 238000004321 preservation Methods 0.000 claims description 15
- 238000003860 storage Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 7
- 238000004148 unit process Methods 0.000 claims description 4
- 238000005520 cutting process Methods 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 238000009826 distribution Methods 0.000 claims description 3
- 238000012423 maintenance Methods 0.000 claims description 3
- 238000003058 natural language processing Methods 0.000 abstract description 12
- 238000010606 normalization Methods 0.000 abstract description 5
- 230000000694 effects Effects 0.000 abstract description 3
- 238000004891 communication Methods 0.000 description 12
- 238000013461 design Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/117—Tagging; Marking up; Designating a block; Setting of attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/383—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/263—Language identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Abstract
本发明公开了一种文档协作的信息标记系统及方法,该系统包括不同语言识别单元、信息量化保存库单元、文档基础信息扫描与归一化单元、边缘计算单元和系统综合管理单元。实施本发明的技术方案可解决现有技术中缺乏自动信息管理、纯人工标记效率低、正确率低、缺少多类型文档标记支持的技术问题;方法上通过功能性标记服务对于新进文档进行标准化预处理以及功能性标记程序,通过自然语言处理算法配合标注把握控制组件以及人工干预,可实现在线进行高效、高正确率、提供自动信息管理和多场景应用的技术效果。
Description
技术领域
本发明涉及文档标记领域,特别涉及一种文档协作的信息标记系统及方法。
背景技术
一方面,在企业、政府、学校等组织中,普遍存在基于文档等内容进行团队协作的场景。例如,在企业和政府中,上级对于下属提交的文档给予审批意见,同事之间针对某个设计图纸进行设计改进沟通;在学校中,老师批改学生提交的作业文档,老师之间针对教学课件进行沟通,进行集体备课活动。这些场景中都需要针对文档、设计图纸等内容进行沟通、交流。另--方面,移动办公越来越普遍,在手机、平板上进行内容社交的需求也越来越强。
当前,在企业网盘、0A、项目协作软件中,针对上述问题提供的解决方法普遍存在以下两个问题:1、只能针对整个文档进行讨论、交流,无法针对文档片段进行更有针对性的沟通交流,这样就导致了沟通不便,沟通信息传递有误等问题;2、在手机、平板等移动设备上基于内容进行沟通交流时,只能使用原始的文字方式进行交流,但是在移动设备上输入复杂、较长的文字时非常不方便。
现有技术CN110175320A公开提出一种文档标记方法和装置,方法包括:对目标文档进行解析,确定所述目标文档对应的各关联用户信息,根据所述目标文档对应的各关联用户信息,确定所述目标文档的属性;根据所述目标文档的属性,对所述目标文档进行标记处理;通过本方法,能够实现根据文档的属性对文档进行标记,引起用户的重视,提醒用户在编辑文档时注意措辞,从而提高信息安全性,解决现有技术中无法对文档进行标记的技术问题;但此技术方案在需要对文档进行搜索时仍需要单独搜索,加大了搜索文档时的时间成本。
发明内容
为了克服现有技术存在的缺点与不足,本发明提供一种文档协作的信息标记系统及方法。
本发明所采用的技术方案是,一种文档协作的信息标记系统,包括不同语言识别单元、信息量化保存库单元、文档基础信息扫描与归一化单元、边缘计算单元和系统综合管理单元;其中:
所述文档基础信息扫描与归一化单元扫描提供的新进文档,按照边缘计算单元产生的文档待标注特征对于所述新进文档进行格式识别处理,产生符合所述算法计算的所述基础协同信息并量化保存所述基础协同信息于所述信息量化保存库单元;
所述边缘计算单元从所述信息量化保存库单元中获得所述基础协同信息,通过调用所述不同语言识别单元的语法处理与语言识别功能进行功能性标记生产所述功能性标记信息,并量化保存所述功能性标记信息在所述信息量化保存库单元;
所述系统综合管理单元为智慧屏触动模式,包括信息自动或手动操作组件,所述信息自动或手动操作组件扫描所述边缘计算单元中的所述基础协同信息和所述功能性标记信息,并用于裁剪、增减和向所述边缘计算单元发送所述基础协同信息和所述功能性标记信息。
进一步地,所述系统综合管理单元为用户操作组件,还包括:
文档初步管理组件,用于记录文档信息和录入数据并向边缘计算单元发送;
用户文档管理组件,用于管理用户的文档信息并向边缘计算单元发送;
标记工具管理组件,用于记录自动增减基础协同信息和自动标记信息并向边缘计算单元发送。
进一步地,所述边缘计算单元包括:
功能性标记组件,通过使用所述不同语言识别单元所提供的功能性标记服务对于所述基础协同信息和/或所述自动增减基础协同信息进行标记处理产生所述功能性标记信息,并将所述功能性标记信息发送并量化保存于所述信息量化保存库单元;
文档标记成果组件,扫描所述文档初步管理组件所提出的文档生成任务数据和所述文档待标注特征,将所述任务数据发送并量化保存于所述信息量化保存库单元,将所述文档待标注特征发送给所述文档基础信息扫描与归一化单元;
标注把握控制组件,对于所述基础协同信息、所述功能性标记信息、所述自动增减基础协同信息和所述自动标记信息采取把握控制方法对标记信息进行标准化处理产生标准化幅值,若所述标准化幅值满足把握控制流程结束,否则向所述信息自动或手动操作组件反馈所述标准化幅值;
客户信息组件,用于扫描所述客户信息并将所述客户信息所述信息量化保存库单元。
进一步地,所述信息量化保存库单元包括:
标记文档量化保存组件,以量化保存来自所述功能性标记组件的所述录入数据、所述基础协同信息和所述功能性标记信息;
在线协调分配组件,用于量化保存来自所述文档标记成果组件产生的任务数据;
系统日常维保组件,用于量化保存包括所述客户数据、特殊信息和所述录入数据。
进一步地,还包括提供系统连接单元,所述提供系统连接单元从所述边缘计算单元获得语法处理与语言识别功能同时提供连接方式。
进一步地,提供系统连接单元还包括端口识别组件,所述端口识别组件对于提供系统连接单元的访问进行端口识别。
进一步地,所述不同语言识别单元还包括新进词汇更新组件,所述新进词汇更新组件能够根据所述信息量化保存库单元中的所述基础协同信息和所述功能性标记信息对于所述不同语言识别单元中的算法进行定期更新。
一种文档协作的信息标记方法,包括如下步骤:
步骤A1:用户通过所述系统综合管理单元向所述边缘计算单元提出所述文档待标注特征和把握控制幅值,所述文档基础信息扫描与归一化单元通过所述边缘计算单元提供的所述文档待标注特征对于所述新进文档所提供的文档统一性处理,产生标准化文档信息的所述基础协同信息,并量化保存所述基础协同信息于所述信息量化保存库单元,执行步骤A2;
步骤A2:所述边缘计算单元从所述信息量化保存库单元中读取所述基础协同信息,通过使用所述不同语言识别单元所提供的语法处理与语言识别功能对于所述基础协同信息进行标记处理产生所述功能性标记信息,执行步骤A3;
步骤A3:所述边缘计算单元对于所述功能性标记信息进行把握控制标准化处理产生标准化幅值,若所述标准化幅值符合所述把握控制幅值范围则执行步骤A5,否则执行步骤A4;
步骤A4:所述边缘计算单元向所述系统综合管理单元发送所述标准化幅值并重新执行步骤A1;
步骤A5:所述边缘计算单元发送所述功能性标记信息到所述信息量化保存库单元,所述信息量化保存库单元量化保存所述功能性标记信息;所述边缘计算单元向所述系统综合管理单元发送所述功能性标记信息,所述系统综合管理单元向用户展示所述功能性标记信息,结束标记方法。
进一步地,还包括步骤A0和步骤A6,
步骤A0:用户进行账号注册、密码登录初步操作,系统在线人数用户在注册时进行设置;
步骤A6:所述边缘计算单元对于本次标记步骤进行记录产生所述任务数据,发送所述任务数据到所述信息量化保存库单元,信息量化保存库单元对于所述任务数据进行储存。
实施本发明的技术方案可解决现有技术中缺乏自动信息管理、纯人工标记效率低、正确率低、缺少多类型文档标记支持的技术问题;实施本发明的技术方案,通过功能性标记服务对于新进文档进行标准化预处理以及功能性标记程序,通过自然语言处理算法配合标注把握控制组件以及人工干预,可实现在线进行高效、高正确率、提供自动信息管理和多场景应用的技术效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一种实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的系统结构图;
图2为本发明的方法流程。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合,下面结合附图和有具体实施例对本申请作进一步详细说明。
实施例
在一种具体实施例中,一种文档协作的信息标记系统,包括不同语言识别单元、信息量化保存库单元、文档基础信息扫描与归一化单元、边缘计算单元和系统综合管理单元;其中:
文档基础信息扫描与归一化单元扫描提供的新进文档,按照边缘计算单元产生的文档待标注特征对于新进文档进行格式识别处理,产生符合算法计算的基础协同信息并量化保存基础协同信息于信息量化保存库单元;
边缘计算单元从信息量化保存库单元中获得基础协同信息,通过调用不同语言识别单元的语法处理与语言识别功能进行功能性标记生产功能性标记信息,并量化保存功能性标记信息在信息量化保存库单元;
系统综合管理单元为智慧屏触动模式,包括信息自动或手动操作组件,信息自动或手动操作组件扫描边缘计算单元中的基础协同信息和功能性标记信息,并用于裁剪、增减和向边缘计算单元发送基础协同信息和功能性标记信息。
进一步地,系统综合管理单元为用户操作组件,还包括:
文档初步管理组件,用于记录文档信息和录入数据并向边缘计算单元发送;
用户文档管理组件,用于管理用户的文档信息并向边缘计算单元发送;
标记工具管理组件,用于记录自动增减基础协同信息和自动标记信息并向边缘计算单元发送。
进一步地,边缘计算单元包括:
功能性标记组件,通过使用不同语言识别单元所提供的功能性标记服务对于基础协同信息和/或自动增减基础协同信息进行标记处理产生功能性标记信息,并将功能性标记信息发送并量化保存于信息量化保存库单元;
文档标记成果组件,扫描文档初步管理组件所提出的文档生成任务数据和文档待标注特征,将任务数据发送并量化保存于信息量化保存库单元,将文档待标注特征发送给文档基础信息扫描与归一化单元;
标注把握控制组件,对于基础协同信息、功能性标记信息、自动增减基础协同信息和自动标记信息采取把握控制方法对标记信息进行标准化处理产生标准化幅值,若标准化幅值满足把握控制流程结束,否则向信息自动或手动操作组件反馈标准化幅值;
客户信息组件,用于扫描客户数据并将客户数据信息量化保存库单元。
进一步地,信息量化保存库单元包括:
标记文档量化保存组件,以量化保存来自功能性标记组件的录入数据、基础协同信息和功能性标记信息;
在线协调分配组件,用于量化保存来自文档标记成果组件产生的任务数据;
系统日常维保组件,用于量化保存包括客户数据、特殊信息和录入数据。
进一步地,还包括提供系统连接单元,提供系统连接单元从边缘计算单元获得语法处理与语言识别功能同时提供连接方式。
进一步地,提供系统连接单元还包括端口识别组件,端口识别组件对于提供系统连接单元的访问进行端口识别。
进一步地,不同语言识别单元还包括新进词汇更新组件,新进词汇更新组件能够根据信息量化保存库单元中的基础协同信息和功能性标记信息对于不同语言识别单元中的算法进行定期更新。
在一种具体实施例中,如图1所示,系统一共分为六个模块:不同语言识别单元、信息量化保存库单元、文档基础信息扫描与归一化单元、边缘计算单元、提供系统连接单元以及系统综合管理单元。其中公开或授权的新进文档可以由现有的各类网站以及信息源作为信息源头提供文档,因而不属于系统架构范畴之内。不同语言识别单元向边缘计算单元提供自然语言处理服务,并根据信息量化保存库单元内对应信息更新其算法和模型。信息量化保存库单元量化保存系统内部相关信息。文档基础信息扫描与归一化单元根据服务器模的输入的文档待标注特征,从新进文档中获取公开文档信息,通过本信息搜集及预处理模块对于文档进行格式识别处理,格式识别处理完成的信息将会被存入到信息量化保存库单元中。边缘计算单元从信息量化保存库单元中获取标记信息以及任务数据,通过调用不同语言识别单元中的自然语言处理服务进行功能性标记;系统综合管理单元进行标记信息的向信息量化保存库单元的量化保存以及向系统综合管理单元的展示,并根据系统综合管理单元提供的标记信息进行把握控制;向系统综合管理单元发送文档信息、客户数据,从系统综合管理单元扫描录入数据。提供系统连接单元从边缘计算单元获取自然语言处理服务并根据端口识别组件的授权对外提供接口。系统综合管理单元从边缘计算单元扫描文档信息、客户数据及标记信息,提供智慧屏触动模式,和用户进行交互,进行文档管理,用户管理以及具体的标记文档,并向边缘计算单元提供标记信息和录入数据。
在本具体实施例中,新进词汇更新组件从信息量化保存库单元中提取待标记文档信息,对不同语言识别单元中的工具进行更新,因此在框架内配置任意需要的自然语言处理工具,供多种不同应用场景和文档使用,包括但不限于:分词、语法分析、文档补全、实体识别、关系抽取等,能够极大程度上适应不同的自然语言处理场景,克服了现有技术中对于功能不全面。由于边缘计算单元的引入,能够按照不同语言识别单元所提供的自然语言处理服务通过功能性标记组件实现文档的功能性标记,提高标记效率,并对使用的自然语言处理算法或模型进行实时自动更新,不断提高功能性标记的准确率使得功能性标记进入良性循环。不同语言识别单元包含一系列自然语言处理工具并向边缘计算单元提供自然语言处理服务。
细分的系统综合管理单元、边缘计算单元和信息量化保存库单元能够较为精准的应用于一般应用场景,但是系统综合管理单元、边缘计算单元和信息量化保存库单元的细化并不局限于本实施例中所涉及的方法。提供系统连接单元的引入不仅能够扩展本发明的功能范围,更能实现多平台的接口通信,从而实现系统资源的最大化利用,方便广大开发者调用进行开发和二次开发。
实施例2:如图2所示:
在一种具体实施例中,基于实施例1的一种文档协作的信息标记方法,包括如下步骤:
步骤A0:用户进行账号注册、密码登录初步操作,系统在线人数用户在注册时进行设置,执行步骤A1;
步骤A1:用户通过系统综合管理单元向边缘计算单元提出文档待标注特征和把握控制幅值,文档基础信息扫描与归一化单元通过边缘计算单元提供的文档待标注特征对于新进文档所提供的文档统一性处理,产生标准化文档信息的基础协同信息,并量化保存基础协同信息于信息量化保存库单元,执行步骤A2;
步骤A2:边缘计算单元从信息量化保存库单元中读取基础协同信息,通过使用不同语言识别单元所提供的语法处理与语言识别功能对于基础协同信息进行标记处理产生功能性标记信息,执行步骤A3;
步骤A3:边缘计算单元对于功能性标记信息进行把握控制标准化处理产生标准化幅值,若标准化幅值符合把握控制幅值范围则执行步骤A5,否则执行步骤A4;
步骤A4:边缘计算单元向系统综合管理单元发送标准化幅值并重新执行步骤A1;
步骤A5:边缘计算单元发送功能性标记信息到信息量化保存库单元,信息量化保存库单元量化保存功能性标记信息;边缘计算单元向系统综合管理单元发送功能性标记信息,系统综合管理单元向用户展示功能性标记信息,执行步骤A6;
步骤A6:所述边缘计算单元对于本次标记步骤进行记录产生所述任务数据,发送所述任务数据到所述信息量化保存库单元,信息量化保存库单元对于所述任务数据进行储存,结束标记流程。
用户通过系统综合管理单元选择具体文档,边缘计算单元从信息量化保存库单元中获取对应文档信息,调用不同语言识别单元的自然语言处理服务处理这些信息,生成初始标记并发送给系统综合管理单元。系统综合管理单元展示标记信息,通过标记工具管理组件和用户进行交互标记,用户完成修改后提交文档,标记流程结束。
边缘计算单元通过标注把握控制组件实现把握控制功能。标注把握控制组件对标记内容进行把握控制,降低信息标记的自动错误,提高标记质量,同时能够为文档基础信息扫描与归一化单元修正文档待标注特征,从而调整文档基础信息扫描与归一化单元的标准化文档信息内容。用户结束标记流程之后提交标记文档,系统综合管理单元将标记信息发送至边缘计算单元,标注把握控制组件采取把握控制方法对标记信息进行评价。如果符合质量要求,则边缘计算单元将标记信息发送至信息量化保存库单元进行量化保存,把握控制流程结束;否则,边缘计算单元将标记信息返回系统综合管理单元,系统综合管理单元向用户展示必要信息,返回标记流程。
文档基础信息扫描与归一化单元的引入能够在最大程度上兼容提供新进文档,包括但不限于公开或授权的内容。边缘计算单元根据用户配置生成需求,发送至文档基础信息扫描与归一化单元。文档基础信息扫描与归一化单元根据该需求从对应的新进文档提取公开文档。文档基础信息扫描与归一化单元对提取的公开文档进行处理,生成符合系统格式的标准化文档信息,然后发送至信息量化保存库单元量化保存。
由于系统搭建并不局限于某特定应用场景,客户可以根据用户实际需求在同一平台内配置多种不同的标记文档,客户信息组件能够实现多个用户以及多个标记文档的并行管理。通过文档标记成果组件对于标记内容进行管理,向信息量化保存库单元或向系统综合管理单元进行信息交互。边缘计算单元通过表及内容管理模块实现多标记文档管理功能。系统综合管理单元通过文档初步管理组件与用户交互,获得用户配置的文档信息,并将其传给边缘计算单元。文档标记成果组件从信息量化保存库单元获取可供选择的标记文档列表,并作为文档信息发送给系统综合管理单元,用户通过与文档初步管理组件进行交互选择文档列表,或上传新的文档信息作为文档信息的补充。系统综合管理单元将这些文档信息以及文档信息传给边缘计算单元,由文档标记成果组件进行汇总并对新上传的文档信息进行预处理,生成对应的任务数据及新的标准化文档。边缘计算单元将该信息传给信息量化保存库单元量化保存。其中,任务数据相互独立,因此本发明支持在一套系统内配置多种不同的标记文档。同时,系统综合管理单元适配多种图形化前端或客户端以实现跨平台的需求和提供多种不同交互方案的需求。
用户通过与系统综合管理单元交互进行人工标记。用户首先与系统综合管理单元交互登录平台。登陆成功后与文档初步管理组件和用户文档管理组件交互选择需要标记的文档。边缘计算单元从信息量化保存库单元中提取文档对应的标记信息并进行判断,如果是初次标记,则由功能性标记组件调用不同语言识别单元中的服务将基础协同信息中的信息进行功能性标记,生成初始标记信息,然后将该信息发送给系统综合管理单元 ;否则直接将文档信息发送给系统综合管理单元。系统综合管理单元获取信息以后通过标记工具管理组件进行展示并和用户进行交互,修改标记内容。在标记结束之前,用户可以和标记工具管理组件进行交互,修改标记信息;或者选择暂存标记进度,此时系统综合管理单元向边缘计算单元发送更新后的标记信息以及相应的录入数据,边缘计算单元将信息发送至信息量化保存库单元进行量化保存,当前标记流程结束。当用户结束了标记,选择提交标记信息,则当前标记流程结束。
在本发明描述中,需要说明的是,除非另有明确的规定和限定,术语“设置”、“安装”、“相连”、“连接”、“固定”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以通过具体情况理解上述术语在本发明中的具体含义。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解的是,在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种等效的变化、修改、替换和变型,本发明的范围由所附权利要求及其等同范围限定。
Claims (9)
1.一种文档协作的信息标记系统,其特征在于:该系统包括不同语言识别单元、信息量化保存库单元、文档基础信息扫描与归一化单元、边缘计算单元和系统综合管理单元;其中:
所述文档基础信息扫描与归一化单元扫描提供的新进文档,按照边缘计算单元产生的文档待标注特征对于所述新进文档进行格式识别处理,产生符合所述算法计算的所述基础协同信息并量化保存所述基础协同信息于所述信息量化保存库单元;
所述边缘计算单元从所述信息量化保存库单元中获得所述基础协同信息,通过调用所述不同语言识别单元的语法处理与语言识别功能进行功能性标记生产所述功能性标记信息,并量化保存所述功能性标记信息在所述信息量化保存库单元;
所述系统综合管理单元为智慧屏触动模式,包括信息自动或手动操作组件,所述信息自动或手动操作组件扫描所述边缘计算单元中的所述基础协同信息和所述功能性标记信息,并用于裁剪、增减和向所述边缘计算单元发送所述基础协同信息和所述功能性标记信息。
2.根据权利要求1所述的一种文档协作的信息标记系统,其特征在于:所述系统综合管理单元为用户操作组件,还包括:
文档初步管理组件,用于记录文档信息和录入数据并向边缘计算单元发送;
用户文档管理组件,用于管理用户的文档信息并向边缘计算单元发送;
标记工具管理组件,用于记录自动增减基础协同信息和自动标记信息并向边缘计算单元发送。
3.根据权利要求2所述的一种文档协作的信息标记系统,其特征在于:所述边缘计算单元包括:
功能性标记组件,通过使用所述不同语言识别单元所提供的功能性标记服务对于所述基础协同信息和/或所述自动增减基础协同信息进行标记处理产生所述功能性标记信息,并将所述功能性标记信息发送并量化保存于所述信息量化保存库单元;
文档标记成果组件,扫描所述文档初步管理组件所提出的文档生成任务数据和所述文档待标注特征,将所述任务数据发送并量化保存于所述信息量化保存库单元,将所述文档待标注特征发送给所述文档基础信息扫描与归一化单元;
标注把握控制组件,对于所述基础协同信息、所述功能性标记信息、所述自动增减基础协同信息和所述自动标记信息采取把握控制方法对标记信息进行标准化处理产生标准化幅值,若所述标准化幅值满足把握控制流程结束,否则向所述信息自动或手动操作组件反馈所述标准化幅值;
客户信息组件,用于扫描所述客户信息并将所述客户信息所述信息量化保存库单元。
4.根据权利要求3所述的一种文档协作的信息标记系统,其特征在于:所述信息量化保存库单元包括:
标记文档量化保存组件,以量化保存来自所述功能性标记组件的所述录入数据、所述基础协同信息和所述功能性标记信息;
在线协调分配组件,用于量化保存来自所述文档标记成果组件产生的任务数据;
系统日常维保组件,用于量化保存包括所述客户数据、特殊信息和所述录入数据。
5.根据权利要求1所述的一种文档协作的信息标记系统,其特征在于:还包括提供系统连接单元,所述提供系统连接单元通过所述边缘计算单元调用所述语法处理与语言识别功能,同时提供连接方式。
6.根据权利要求5所述的一种文档协作的信息标记系统,其特征在于:提供系统连接单元还包括端口识别组件,所述端口识别组件对于提供系统连接单元的访问进行端口识别。
7.根据权利要求1所述的一种文档协作的信息标记系统,其特征在于:所述不同语言识别单元还包括新进词汇更新组件,所述新进词汇更新组件能够根据所述信息量化保存库单元中的所述基础协同信息和所述功能性标记信息对于所述不同语言识别单元中的算法进行定期更新。
8.一种文档协作的信息标记方法,其特征在于,包括如下步骤:
步骤A1:用户通过所述系统综合管理单元向所述边缘计算单元提出所述文档待标注特征和把握控制幅值,所述文档基础信息扫描与归一化单元通过所述边缘计算单元提供的所述文档待标注特征对于所述新进文档所提供的文档统一性处理,产生标准化文档信息的所述基础协同信息,并量化保存所述基础协同信息于所述信息量化保存库单元,执行步骤A2;
步骤A2:所述边缘计算单元从所述信息量化保存库单元中读取所述基础协同信息,通过使用所述不同语言识别单元所提供的语法处理与语言识别功能对于所述基础协同信息进行标记处理产生所述功能性标记信息,执行步骤A3;
步骤A3:所述边缘计算单元对于所述功能性标记信息进行把握控制标准化处理产生标准化幅值,若所述标准化幅值符合所述把握控制幅值范围则执行步骤A5,否则执行步骤A4;
步骤A4:所述边缘计算单元向所述系统综合管理单元发送所述标准化幅值并重新执行步骤A1;
步骤A5:所述边缘计算单元发送所述功能性标记信息到所述信息量化保存库单元,所述信息量化保存库单元量化保存所述功能性标记信息;所述边缘计算单元向所述系统综合管理单元发送所述功能性标记信息,所述系统综合管理单元向用户展示所述功能性标记信息。
9.根据权利要求8所述的一种文档协作的信息标记方法,其特征在于:还包括步骤A0和步骤A6,
步骤A0:用户进行账号注册、密码登录初步操作,系统在线人数用户在注册时进行设置;
步骤A6:所述边缘计算单元对于本次标记步骤进行记录产生所述任务数据,发送所述任务数据到所述信息量化保存库单元,信息量化保存库单元对于所述任务数据进行储存。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310960596.9A CN116702704A (zh) | 2023-08-02 | 2023-08-02 | 一种文档协作的信息标记系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310960596.9A CN116702704A (zh) | 2023-08-02 | 2023-08-02 | 一种文档协作的信息标记系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116702704A true CN116702704A (zh) | 2023-09-05 |
Family
ID=87831434
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310960596.9A Pending CN116702704A (zh) | 2023-08-02 | 2023-08-02 | 一种文档协作的信息标记系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116702704A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090144280A1 (en) * | 2007-12-03 | 2009-06-04 | Barry Rongsheng Su | Electronic multilingual business information database system |
CN111414331A (zh) * | 2020-03-26 | 2020-07-14 | 北京字节跳动网络技术有限公司 | 在线协同知识库的文档导入方法、装置、存储介质及设备 |
CN111783391A (zh) * | 2020-05-28 | 2020-10-16 | 孙炜 | 一种在线人工文本标记系统及方法 |
CN116384889A (zh) * | 2022-11-24 | 2023-07-04 | 杭州半云科技有限公司 | 基于自然语言处理技术的情报大数据智能分析方法 |
-
2023
- 2023-08-02 CN CN202310960596.9A patent/CN116702704A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090144280A1 (en) * | 2007-12-03 | 2009-06-04 | Barry Rongsheng Su | Electronic multilingual business information database system |
CN111414331A (zh) * | 2020-03-26 | 2020-07-14 | 北京字节跳动网络技术有限公司 | 在线协同知识库的文档导入方法、装置、存储介质及设备 |
CN111783391A (zh) * | 2020-05-28 | 2020-10-16 | 孙炜 | 一种在线人工文本标记系统及方法 |
CN116384889A (zh) * | 2022-11-24 | 2023-07-04 | 杭州半云科技有限公司 | 基于自然语言处理技术的情报大数据智能分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108647277B (zh) | 一种移动校园综合服务平台及其工作方法 | |
Alshurafat | The usefulness and challenges of chatbots for accounting professionals: Application on ChatGPT | |
CN111192060B (zh) | 一种基于电力it服务全渠道自助应答实现方法 | |
EP3617896A1 (en) | Method and apparatus for intelligent response | |
CN107784033B (zh) | 一种基于会话进行推荐的方法和装置 | |
CN109670023A (zh) | 人机自动面试方法、装置、设备和存储介质 | |
US11170214B2 (en) | Method and system for leveraging OCR and machine learning to uncover reuse opportunities from collaboration boards | |
CN104281615A (zh) | 一种投诉处理的方法和系统 | |
CN110489749B (zh) | 一种智能办公自动化系统的业务流程优化方法 | |
TW202036323A (zh) | 智能線上客服匯流核心系統 | |
Channgam et al. | Intelligent information management with digitization workflow | |
CN111523646A (zh) | 基于物联网的远程教育学习中心智慧感知网络及管理方法 | |
CN116702704A (zh) | 一种文档协作的信息标记系统及方法 | |
CN115203617A (zh) | 一种基于rpa的网页访问单按钮辅助输入系统 | |
CN112687380B (zh) | 一种医师评价系统的数据加载方法及质控平台 | |
CN112860873B (zh) | 智能应答方法、装置及存储介质 | |
CN112804274B (zh) | 一种财务共享系统及方法 | |
CN110196875B (zh) | 一种基于配置实现数据交互的方法 | |
CN110443202A (zh) | 论文字体工整度即时分析平台、方法及存储介质 | |
CN111144409A (zh) | 一种跟单托收审单处理方法及系统 | |
CN110766572A (zh) | 基于bs的教师培训数据采集管理系统 | |
CN109218399A (zh) | 一种高校间虚拟现实结合的远程操控实验设备的实现方法 | |
Liu | Application of Genetic Algorithm in Intelligent Student Management Information System | |
CN117973747A (zh) | 一种集成在线用户诉求处理与员工培训的智能系统 | |
He et al. | Research on Dynamic Technology of Digital Benefit Intelligent Quantitative Control |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |