CN106372037B - 一种以语块为基本单位的文档处理方法 - Google Patents

一种以语块为基本单位的文档处理方法 Download PDF

Info

Publication number
CN106372037B
CN106372037B CN201610767492.6A CN201610767492A CN106372037B CN 106372037 B CN106372037 B CN 106372037B CN 201610767492 A CN201610767492 A CN 201610767492A CN 106372037 B CN106372037 B CN 106372037B
Authority
CN
China
Prior art keywords
language block
language
document
block
basic unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610767492.6A
Other languages
English (en)
Other versions
CN106372037A (zh
Inventor
吴忠辉
杜红祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Younongfu Technology Development Guangdong Co ltd
Original Assignee
GUANGZHOU CCM INFORMATION SCIENCE AND Tech CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GUANGZHOU CCM INFORMATION SCIENCE AND Tech CO Ltd filed Critical GUANGZHOU CCM INFORMATION SCIENCE AND Tech CO Ltd
Priority to CN201610767492.6A priority Critical patent/CN106372037B/zh
Publication of CN106372037A publication Critical patent/CN106372037A/zh
Application granted granted Critical
Publication of CN106372037B publication Critical patent/CN106372037B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种以语块为基本单位的文档处理方法,包括:创建文档项目和该文档项目的目录大纲;其中,目录大纲用于记录目录信息及目录结构;根据目录大纲的目录结构,在目录大纲下添加若干个语块,并对若干个语块进行编辑;其中,各语块均设置有属性标记,并存储在同一语块库中;属性标记包括:价值标记、内容标记、语义标记、位置标记以及引用状态标记;存储以语块为基本单位的文档项目。采用本发明实施例能降低存储冗余度,便于多人共同在线编辑同一文档。

Description

一种以语块为基本单位的文档处理方法
技术领域
本发明涉及计算机技术领域,尤其涉及一种以语块为基本单位的文档处理方法。
背景技术
现有的文字处理基本是基于文档编辑软件,比如MS office、WPS office等,这些软件是以文档为对象进行处理,一个文档同时只能由一个人进行操作,不能实现实时共享、分工与流程控制、多人同时作业等功能。现有技术中如果需要多人参与同一个文档的处理,需要基于文档在线分享平台,多人在不同时间段分别对同一个文档进行操作,在文档有人操作的时间段内,必须要签出锁定文档不允许其他人修改,否则将导致内容丢失或协作冲突。在操作完成保存后要解锁签入文档,才能允许下一个人再操作。另一方法是离线进行,如事先商定不同人员所负责的内容部分,然后分别各自建立文档单独操作,各自操作后,进行文档合并。这个过程容易产生不同文档格式冲突、内容丢失、误操作等问题,而且文档合并费时费力,当需要多人校审检查时,必须一人完成后才能由另一个人校审,周期较长,影响文档的时效性。另外,在进行文档版本管理时,一处小的修改可能就要保存一个新的版本,造成内容冗余,浪费存储空间。
发明内容
本发明实施例提出一种以语块为基本单位的文档处理方法,降低存储冗余度,便于多人共同在线编辑同一文档。
本发明实施例提供一种以语块为基本单位的文档处理方法,包括:
创建文档项目和所述文档项目的目录大纲;其中,所述目录大纲用于记录目录信息及目录结构;
根据所述目录大纲的目录结构,在所述目录大纲下添加若干个语块,并对所述若干个语块进行编辑;其中,各所述语块均设置有属性标记,并存储在同一语块库中;所述属性标记包括:价值标记、内容标记、语义标记、位置标记以及引用状态标记;
存储以所述语块为基本单位的所述文档项目。
进一步的,所述以语块为基本单位的文档处理方法还包括:
根据所述语块的属性标记,将所述语块从语块库中提取处理,并以文档撰写的语义逻辑组织和呈现给用户。
进一步的,所述以语块为基本单位的文档处理方法还包括:
获取用户输入的搜索调用命令,并根据所述搜索调用命令查询所述语块库中各语块的属性标记,确定需要被调用的语块;
将所述需要被调用的语块从所述语块库中调出。
进一步的,所述根据所述目录大纲的目录结构,在所述目录大纲下添加若干个语块,并对所述若干个语块进行编辑之后,还包括:
删除所述目录大纲下中的任一语块。
进一步的,所述语块的内容为文本、静态图像、动态图表、图表对象加载后台数据或多媒体文件。
进一步的,所述语块的内容为新撰写内容或者为其他文档项目中已编辑语块的内容。
实施本发明实施例,具有如下有益效果:
本发明实施例提供的一种以语块为基本单位的文档处理方法,通过创建文档项目和文档项目的目录大纲实现各文档的管理,每个文档项目均以语块为基本单位来存储文档所属的图文内容,用户可以在文档项目中按照目录结构添加或删除语块,并对语块进行文档编辑,最后存储已编辑好的文档项目。相比于现有技术以单一个文档为基本单位进行文档处理,本发明技术方案中的文档项目以语块为基本单位,各语块之间相互独立,用户编辑时从语块库中读取,无需重复存储,降低存储冗余度。而且本发明技术方案只需将各语块划分给不同的人即可实现多人同时在线编辑同一个文档,提高多人协作编辑的效率。
进一步的,所有文档项目中的语块存储在同一个语块库中,并对语块进行不同维度的属性标记,通过这些属性标记可以准确查找出相关的语块,由于语块具有单一语义主题的特点,所含内容短小,不存在二次查找问题,便于内容资源的再利用和知识管理。
附图说明
图1是本发明提供的以语块为基本单位的文档处理方法的一种实施例的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,是本发明提供的以语块为基本单位的文档处理方法的一种实施例的流程示意图,该方法包括步骤101至步骤103,各步骤具体如下:
步骤101:创建文档项目和该文档项目的目录大纲;其中,目录大纲用于记录目录信息及目录结构。
在本实施例中,文档项目用于记录创建人员录入的相关信息如项目名称、类型、结束时间、参与人员和项目负责人等基本信息。目录大纲用于记录目录信息及目录结构,其中,目录信息包括目录名称、目录下的语块包括哪些、主目录下包含哪些子目录等相关信息。
步骤102:根据目录大纲的目录结构,在目录大纲下添加若干个语块,并对若干个语块进行编辑;其中,各语块均设置有属性标记,并存储在同一语块库中;属性标记包括:价值标记、内容标记、语义标记、位置标记以及引用状态标记。
在本实施例中,每个语块均具有单一语义主题,且语块的内容可以但不限于为文本、静态图像、动态图表、图表对象加载后台数据或多媒体文件。语块的内容为新撰写内容或者为其他文档项目中已编辑语块的内容。如语块为一段文字,则这段文字描述了一个单一的主题并且意思完整,控制字数在10-1000字之间。如果语块为一个图或表,则这个图或表可以包含标题、来源、图标备注说明及图表本身等部分。
每个语块均设置有属性标记,并存储在同一个语块库中。属性标记包括:价值标记、内容标记、语义标记、位置标记以及引用状态标记等多种维度,用户也可将多个相邻的语块标记组在一起,或自定义属性标记。
步骤103:存储以语块为基本单位的文档项目。
作为本实施例的一种举例,本发明提供的以语块为基本单位的文档处理方法还包括:根据语块的属性标记,将语块从语块库中提取处理,并以文档撰写的语义逻辑组织和呈现给用户。在本举例中,语块可以单独从语块库中提取调用在不同的项目文档中,以便语块的重复利用,减少文档编辑时间,提高效率。
作为本实施例的一种举例,本发明提供的以语块为基本单位的文档处理方法还包括:获取用户输入的搜索调用命令,并根据搜索调用命令查询语块库中各语块的属性标记,确定需要被调用的语块;将需要被调用的语块从语块库中调出。现有技术基于文档的内容存储很难对特定内容进行检索、定位和再利用,造成企业内容资源的浪费。在查找目标文档时通常是基于文档标题查找,如果文档标题与内容不是十分吻合、或者文档中有些内容与标题不直接相关时,这些内容被找出并再利用的概率极低,而进行全文查找时,又会耗费太多的系统资源。即使在找到目标文件后,要从中找出想要的特定内容还需要在文档中进行二次查找,效率低下。而本举例中存储的文档项目以语块为基本单位,且语块具有单一语义主题,用户只需输入搜索调用命令,即可查询语块库中各语块的属性标记,确定需要被调用或查找的语块,不存在二次查找的问题,提高内容资源的再利用率。
在本实施例中,在根据目录大纲的目录结构,在目录大纲下添加若干个语块,并对若干个语块进行编辑之后,还包括:删除目录大纲下中的任一语块。用户可以对语块进行添加、删除或修改等语块管理,也可以对每个语块进行文档编辑,如修改语块内容,提高文档项目的编辑效率。
由上可见,本发明实施例提供的一种以语块为基本单位的文档处理方法,通过创建文档项目和文档项目的目录大纲实现各文档的管理,每个文档项目均以语块为基本单位来存储文档所属的图文内容,用户可以在文档项目中按照目录结构添加或删除语块,并对语块进行文档编辑,最后存储已编辑好的文档项目。相比于现有技术以单一个文档为基本单位进行文档处理,本发明技术方案中的文档项目以语块为基本单位,各语块之间相互独立,用户编辑时从语块库中读取,无需重复存储,降低存储冗余度。而且本发明技术方案只需将各语块划分给不同的人即可实现多人同时在线编辑同一个文档,提高多人协作编辑的效率。
进一步的,所有文档项目中的语块存储在同一个语块库中,并对语块进行不同维度的属性标记,通过这些属性标记可以准确查找出相关的语块,由于语块具有单一语义主题的特点,所含内容短小,不存在二次查找问题,便于内容资源的再利用和知识管理。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (5)

1.一种以语块为基本单位的文档处理方法,其特征在于,包括:
创建文档项目和所述文档项目的目录大纲;其中,所述目录大纲用于记录目录信息及目录结构;
根据所述目录大纲的目录结构,在所述目录大纲下添加若干个语块,并对所述若干个语块进行编辑;其中,各所述语块均设置有属性标记,并存储在同一语块库中;所述属性标记包括:价值标记、内容标记、语义标记、位置标记以及引用状态标记;将多个相邻的语块标记组在一起或自定义属性标记;
根据所述语块的属性标记,将所述语块从语块库中提取处理,并以文档撰写的语义逻辑组织和呈现给用户;
存储以所述语块为基本单位的所述文档项目。
2.根据权利要求1所述的以语块为基本单位的文档处理方法,其特征在于,还包括:
获取用户输入的搜索调用命令,并根据所述搜索调用命令查询所述语块库中各语块的属性标记,确定需要被调用的语块;
将所述需要被调用的语块从所述语块库中调出。
3.根据权利要求 1所述的以语块为基本单位的文档处理方法,其特征在于,所述根据所述目录大纲的目录结构,在所述目录大纲下添加若干个语块,并对所述若干个语块进行编辑之后,还包括:
删除所述目录大纲下中的任一语块。
4.根据权利要求1至3任一项所述的以语块为基本单位的文档处理方法,其特征在于,所述语块的内容为文本、静态图像、动态图表和图表对象加载后台数据。
5.根据权利要求4所述的以语块为基本单位的文档处理方法,其特征在于,所述语块的内容为新撰写内容或者为其他文档项目中已编辑语块的内容。
CN201610767492.6A 2016-08-30 2016-08-30 一种以语块为基本单位的文档处理方法 Active CN106372037B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610767492.6A CN106372037B (zh) 2016-08-30 2016-08-30 一种以语块为基本单位的文档处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610767492.6A CN106372037B (zh) 2016-08-30 2016-08-30 一种以语块为基本单位的文档处理方法

Publications (2)

Publication Number Publication Date
CN106372037A CN106372037A (zh) 2017-02-01
CN106372037B true CN106372037B (zh) 2019-09-20

Family

ID=57901703

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610767492.6A Active CN106372037B (zh) 2016-08-30 2016-08-30 一种以语块为基本单位的文档处理方法

Country Status (1)

Country Link
CN (1) CN106372037B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101350009A (zh) * 2008-09-05 2009-01-21 中国工商银行股份有限公司 一种协同文档编写系统
CN101556593A (zh) * 2008-04-11 2009-10-14 北京亿企通信息技术有限公司 一种多人协同工作文档管理的方法和系统
CN103631763A (zh) * 2013-12-12 2014-03-12 用友软件股份有限公司 多人协作的大型文档编辑装置和大型文档编辑方法
KR20160100848A (ko) * 2015-02-16 2016-08-24 (주) 퍼릭스 협업 업무 관리 시스템 및 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101556593A (zh) * 2008-04-11 2009-10-14 北京亿企通信息技术有限公司 一种多人协同工作文档管理的方法和系统
CN101350009A (zh) * 2008-09-05 2009-01-21 中国工商银行股份有限公司 一种协同文档编写系统
CN103631763A (zh) * 2013-12-12 2014-03-12 用友软件股份有限公司 多人协作的大型文档编辑装置和大型文档编辑方法
KR20160100848A (ko) * 2015-02-16 2016-08-24 (주) 퍼릭스 협업 업무 관리 시스템 및 방법

Also Published As

Publication number Publication date
CN106372037A (zh) 2017-02-01

Similar Documents

Publication Publication Date Title
CN108763171B (zh) 一种基于格式模板的文档自动化生成方法
US11250209B2 (en) Document collaboration and consolidation tools and methods of use
KR101608099B1 (ko) 문서의 동시적인 협업적 검토
US6377946B1 (en) Document search method and apparatus and portable medium used therefor
JP4141556B2 (ja) 構造化文書管理方法及びその実施装置並びにその処理プログラムを記録した媒体
Zacklad Documentarisation processes in Documents for Action (DofA): the status of annotations and associated cooperation technologies
US11238396B2 (en) High performance map editor for business analysts
CN102193906A (zh) Word格式试卷自动导入数据库系统的方法
CN102110102A (zh) 数据处理方法及装置、文件识别方法及工具
US20230013179A1 (en) Method for saving documents in blocks
JP2014010837A (ja) 技術動向分析報告書生成システムおよび記録媒体
US9652456B2 (en) Automated relationship management for darwin information typing architecture
US8032521B2 (en) Managing structured content stored as a binary large object (BLOB)
US20090193053A1 (en) Information management system
Wiggins Effective document and data management: Unlocking corporate content
CN106372037B (zh) 一种以语块为基本单位的文档处理方法
CN106372150B (zh) 一种以语块为基本单位的文档处理系统
JPH08305724A (ja) 設計支援情報文書管理装置
CN106326203B (zh) 一种基于语块的文档项目编辑方法
JP2000339306A (ja) 文書作成装置
CN115048659A (zh) 共享对象的共享方法、装置、电子设备和存储介质
CN106354704B (zh) 一种基于语块的文档项目编辑系统
Forward et al. Shared geospatial metadata repository for Ontario University libraries: Collaborative approaches
Cummings et al. The Holinshed Project: Comparing and linking two editions of Holinshed's Chronicle
CN107632969B (zh) 用于管理信息系统的文档生成方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220507

Address after: 510000 North District fghi area, 17th floor, No. 80 Xianlie Middle Road, Yuexiu District, Guangzhou City, Guangdong Province

Patentee after: Younongfu technology development (Guangdong) Co.,Ltd.

Address before: Room A-I, 17th floor, 80 Xianlie Middle Road, Yuexiu District, Guangzhou, Guangdong 510000

Patentee before: GUANGZHOU CCM INFORMATION SCIENCE & TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Document Processing Method Based on Chunks

Effective date of registration: 20230614

Granted publication date: 20190920

Pledgee: Bank of China Limited Guangzhou Yuexiu Branch

Pledgor: Younongfu technology development (Guangdong) Co.,Ltd.

Registration number: Y2023980044026

PE01 Entry into force of the registration of the contract for pledge of patent right