CN112784539A - 一种自动生成文档样式集的方法及装置 - Google Patents

一种自动生成文档样式集的方法及装置 Download PDF

Info

Publication number
CN112784539A
CN112784539A CN201911093117.8A CN201911093117A CN112784539A CN 112784539 A CN112784539 A CN 112784539A CN 201911093117 A CN201911093117 A CN 201911093117A CN 112784539 A CN112784539 A CN 112784539A
Authority
CN
China
Prior art keywords
document
style
format
style set
styles
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911093117.8A
Other languages
English (en)
Inventor
张桂源
蒙燕玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Original Assignee
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Office Software Inc, Zhuhai Kingsoft Office Software Co Ltd filed Critical Beijing Kingsoft Office Software Inc
Priority to CN201911093117.8A priority Critical patent/CN112784539A/zh
Publication of CN112784539A publication Critical patent/CN112784539A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本文公开了一种自动生成文档样式集的方法及装置。所述自动生成文档样式集的方法包括:遍历文档的段落,将具有相同段落格式的文本划分为同一格式组;根据格式组的格式信息生成所述格式组对应的样式;由多个格式组对应的样式生成所述文档的样式集合。本文的技术方案能够自动从文档中提取出样式并形成集合供编辑者日后使用,提高文本编辑的效率。

Description

一种自动生成文档样式集的方法及装置
技术领域
本发明涉及办公自动化技术领域,尤其涉及的是一种自动生成文档样式集的方法及装置。
背景技术
在电子文档中,“样式”是一组格式的集合。如附图1所示,该样式包含了字体格式“宋体”、“5号”、“无加粗”和“无斜体”等,以及段落格式“两端对齐”、“单倍行距”等,这一系列格式的集合,被命名为“正文”,放在软件界面上,供用户直接点击套用。
文本编辑软件一般内置一套默认的通用样式,适用于没有特殊格式要求的文档。但是,针对有特定格式要求的文档,如果想要重复利用某种样式,用户就要自己新建此样式,并一步一步设置好它的名称、格式等信息。
当文档包含的格式较多时,由用户自己一步一步创建样式会大大降低编辑效率。
发明内容
本文提供一种自动生成文档样式集的方法及装置,能够自动从文档中提取出样式并形成集合供编辑者日后使用,提高文本编辑的效率。
根据本申请的第一方面,本发明实施例提供一种自动生成文档样式集的方法,包括:
遍历文档的段落,将具有相同段落格式的文本划分为同一格式组;
根据格式组的格式信息生成所述格式组对应的样式;
由多个格式组对应的样式生成所述文档的样式集合。
根据本申请的第二方面,本发明实施例提供一种自动生成文档样式集的装置,包括:
分组模块,用于遍历文档的段落,将具有相同段落格式的文本划分为同一格式组;
样式生成模块,用于根据格式组的格式信息生成所述格式组对应的样式;
样式集生成模块,用于根据格式组的格式信息生成所述格式组对应的样式。
根据本申请的第三方面,本发明实施例提供一种自动生成文档样式集的装置,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的自动生成文档样式集的程序,所述自动生成文档样式集的程序被所述处理器执行时实现上述自动生成文档样式集的方法的步骤。
根据本申请的第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有自动生成文档样式集的程序,所述自动生成文档样式集的程序被处理器执行时实现上述自动生成文档样式集的方法的步骤。
与相关技术相比,本发明实施例提供的一种自动生成文档样式集的方法及装置,通过遍历文档的段落,将具有相同段落格式的文本划分为同一格式组,根据格式组的格式信息生成所述格式组对应的样式,由多个格式组对应的样式生成所述文档的样式集合。通过生成样式集合能够省去用户一步一步手动创建多个样式的麻烦,将形成的样式集合供编辑者日后使用,能够提高文本编辑的效率。
附图说明
图1为现有技术中修改样式的示意图;
图2为本发明实施例1的一种自动生成文档样式集的方法的流程图;
图3为本发明实施例2的一种自动生成文档样式集的装置的示意图;
图4为本发明示例1的一种自动生成文档样式集的方法的流程图;
图5为示例1中根据特定格式的文本自动生成样式集的示意图;
图6为示例1中更改样式集名称的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在下文中,样式集合和样式集具有相同的含义。
实施例1
如图2所示,本发明实施例提供了一种自动生成文档样式集的方法,包括:
步骤S110,遍历文档的段落,将具有相同段落格式的文本划分为同一格式组;
步骤S120,根据格式组的格式信息生成所述格式组对应的样式;
步骤S130,由多个格式组对应的样式生成所述文档的样式集合。
在上述实施方式中,遍历文档的所有段落,将具有相同段落格式的文本划分为同一格式组,根据格式组的格式信息生成所述格式组对应的样式,由多个格式组对应的样式生成所述文档的样式集合,省去了用户一步一步手动创建多个样式的麻烦,提高了文本编辑的效率。
在一种实施方式中,所述遍历文档的段落,包括:
遍历文档全文或者遍历文档中被用户选中的内容。
比如,用户可以选中文档中的部分内容,然后只针对选中的文档内容生成样式集。选中部分内容生成样式集的好处是,用户可以从一个文档中选择最常用的格式生成样式集,也可以从一个文档中派生出多个样式集。系统默认的设置可以是针对文档全文生成样式集。
在一种实施方式中,所述段落格式包括以下格式的一种或多种:字体格式、行间距、段落对齐方式和缩进方式;
其中,字体格式比如:字体类型、字体大小、字体的特殊格式等;其中,字体的特殊格式比如:字体有无加粗,字体有无下划线,字体是否为斜体等。
在一种实施方式中,由多个格式组对应的样式生成所述文档的样式集合后,所述方法还包括:
在显示样式和格式的窗口中显示所述样式集合中所有样式的列表;
在一种实施方式中,所述方法还包括:在显示样式和格式的窗口中,当所述样式集合中的一个样式被选中后,提供以下样式操作选项中的一种或多种供用户操作;
所述样式操作选项包括:编辑,重命名,删除。
其中,用户对样式进行编辑时,在显示样式和格式的窗口中可以弹出样式编辑窗口,所述样式编辑窗口中提供各种格式修改选项供用户使用,比如,修改字体大小,修改行间距等。用户还可以对样式进行重命名或删除操作。
在一种实施方式中,所述方法还包括:在显示样式和格式的窗口中,提供以下样式集操作选项中的一项或多项供用户操作;
所述样式集操作选项包括:打开,编辑,重命名,删除。
在一种实施方式中,在样式集被编辑时,还提供删除所述样式集中的样式或编辑所述样式集中的样式的选项供用户操作。
其中,用户打开一个样式集时,在显示样式和格式的窗口中显示所述样式集包括的所有样式列表。用户对所述样式集进行编辑时,所述样式集中的每一个样式都是可以被删除或重新编辑的。用户还可以对样式集进行重命名或删除操作。
实施例2
如图3所示,本发明实施例提供了一种自动生成文档样式集的装置,包括:
分组模块10,用于遍历文档的段落,将具有相同段落格式的文本划分为同一格式组;
样式生成模块20,用于根据格式组的格式信息生成所述格式组对应的样式;
样式集生成模块30,用于根据格式组的格式信息生成所述格式组对应的样式。
在一种实施方式中,所述装置还包括:显示和编辑模块40;
所述显示和编辑模块,用于在显示样式和格式的窗口中显示所述样式集合中所有样式的列表。
在一种实施方式中,所述显示和编辑模块,还用于在显示样式和格式的窗口中,当所述样式集合中的一个样式被选中后,提供以下样式操作选项中的一种或多种供用户操作;所述样式操作选项包括:编辑,重命名,删除。
在一种实施方式中,所述显示和编辑模块,还用于在显示样式和格式的窗口中,提供以下样式集操作选项中的一项或多项供用户操作;所述样式集操作选项包括:打开,编辑,重命名,删除。
在一种实施方式中,所述显示和编辑模块,还用于在样式集被编辑时,还提供删除所述样式集中的样式或编辑所述样式集中的样式的选项供用户操作。
在一种实施方式中,所述样式生成模块,用于采用以下方式遍历文档的段落:遍历文档全文或者遍历文档中被用户选中的内容。
在一种实施方式中,所述段落格式包括以下格式的一种或多种:字体格式、行间距、段落对齐方式和缩进方式。
实施例3
本发明实施例提供了一种自动生成文档样式集的装置,包括:
存储器、处理器及存储在所述存储器上并可在所述处理器上运行的自动生成文档样式集的程序,所述自动生成文档样式集的程序被所述处理器执行时实现上述实施例1中的自动生成文档样式集的方法的步骤。
实施例4
本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有自动生成文档样式集的程序,所述自动生成文档样式集的程序被处理器执行时实现上述实施例1中的自动生成文档样式集的方法的步骤。
示例1
本示例提供一种自动生成文档样式集的方法,如图4所示,所述自动生成文档样式集的方法可以包括以下步骤:
S101,检测到用户启用生成样式集功能;
用户启用生成样式集功能可以通过多种方式。比如,用户点击界面上的“生成样式集”按钮;或者,用户通过工具栏中的选项,选中“生成样式集”选项。
S102,遍历文档的所有段落,将具有相同段落格式的文本划分为同一格式组;
其中,所述段落格式包括以下格式的一种或多种:字体格式、行间距、段落对齐方式和缩进方式;
其中,字体格式比如:字体类型、字体大小、字体的特殊格式等;其中,字体的特殊格式比如:字体有无加粗,字体有误下划线,字体是否为斜体等;
S103,根据每一组格式组的格式信息生成对应的样式;
其中,系统在根据格式组的格式信息生成所述格式组对应的样式后,可以为所述样式自动命名,比如,起名为“样式1”,“样式2”,“样式3”等。在整个样式集合生成后,用户可以对样式集合中的各个样式重命名。
S104,由所述文档的所有样式生成所述文档的样式集合。
其中,系统在生成样式集合后,可以为所述样式集合自动命名,比如,起名为“样式集1”。在样式集合生成后,用户还可以对所述样式集进行重命名。
如图5所示,系统自动生成的样式集名字可以是“样式集1”,然后用户可以将其重新命名为“公文”,并且对所述样式集中的所有样式重命名。图5的公文具有特定的格式,由图5的公文生成的样式集可以包括以下样式:份号,密级和保密期限,紧急程度,发文机关标志,发文字号,正文标题,正文第一级,正文第二级,版记,正文。
名称为“份号”的样式是根据文档中的下述内容生成的:000001。
名称为“密级和保密期限”的样式是根据文档中的下述内容生成的:机密★1年。
名称为“紧急程度”的样式是根据文档中的下述内容生成的:特急。
名称为“发文机关标志”的样式是根据文档中的下述内容生成的:XXX文件。
名称为“发文字号”的样式是根据文档中的下述内容生成的:XXX[2019]XX号。
名称为“正文标题”的样式是根据文档中的下述内容生成的:关于开展XXX活动的通报。
名称为“正文第一级”的样式是根据文档中的下述内容生成的:“一、活动宗旨”和“二、活动要求”。系统在生成这个样式时,首先通过遍历全文发现全文中共有两个段落是这种标题格式,然后将这两个段落作为一个格式组,生成所述格式组对应的样式。
名称为“正文第二级”的样式是根据文档中的下述内容生成的:“(一)比赛分类”和“(二)比赛要求”。系统在生成这个样式时,首先通过遍历全文发现全文中共有两个段落是这种标题格式,然后将这两个段落作为一个格式组,生成所述格式组对应的样式。
名称为“版记”的样式是根据文档中的下述内容生成的:“抄送:单位1,单位2,…”,“XXX印发单位”和“XXXX年XX月XX日印发”。
名称为“正文”的样式是根据文档中的其他内容生成的,一般不属于标题或特殊格式的内容都会被系统自动标识为“正文”。“正文”样式属于现有技术。
在上述对图5中样式名称和公文内容的对应关系的描述中,对公文内容的描述仅仅限于文字内容,没有细致描述段落的格式。上述描述的主要目的是示例性地解释一下样式和公文段落的关系。
其中,如图6所示,系统自动为生成的样式集命名后,如果用户想要重新为样式集命名,也可以在显示样式和格式的窗口中,选中样式集名称后,通过重命名的方式进行名称修改。
在上述示例中,遍历文档的所有段落,将具有相同段落格式的文本划分为同一格式组,根据每一组格式组的格式信息生成对应的样式,由所述文档的所有样式生成所述文档的样式集合,实现了一键完成文档样式集的生成,省去了用户一步一步手动创建多个样式的麻烦,提高了文本编辑的效率。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
需要说明的是,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (9)

1.一种自动生成文档样式集的方法,包括:
遍历文档的段落,将具有相同段落格式的文本划分为同一格式组;
根据格式组的格式信息生成所述格式组对应的样式;
由多个格式组对应的样式生成所述文档的样式集合。
2.如权利要求1所述的方法,其特征在于:
由多个格式组对应的样式生成所述文档的样式集合后,所述方法还包括:在显示样式和格式的窗口中显示所述样式集合中所有样式的列表。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
在显示样式和格式的窗口中,当所述样式集合中的一个样式被选中后,提供以下样式操作选项中的一种或多种供用户操作;
所述样式操作选项包括:编辑,重命名,删除。
4.如权利要求2所述的方法,其特征在于,所述方法还包括:
在显示样式和格式的窗口中,提供以下样式集操作选项中的一项或多项供用户操作;
所述样式集操作选项包括:打开,编辑,重命名,删除。
5.如权利要求4所述的方法,其特征在于:
在样式集被编辑时,还提供删除所述样式集中的样式或编辑所述样式集中的样式的选项供用户操作。
6.如权利要求1所述的方法,其特征在于:
所述遍历文档的段落,包括:
遍历文档全文或者遍历文档中被用户选中的内容。
7.如权利要求1-6中任一项所述的方法,其特征在于:
所述段落格式包括以下格式的一种或多种:字体格式、行间距、段落对齐方式和缩进方式。
8.一种自动生成文档样式集的装置,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的自动生成文档样式集的程序,所述自动生成文档样式集的程序被所述处理器执行时实现上述权利要求1-7中任一项所述的自动生成文档样式集的方法的步骤。
9.一种计算机可读存储介质,所述计算机可读存储介质上存储有自动生成文档样式集的程序,所述自动生成文档样式集的程序被处理器执行时实现上述权利要求1-7中任一项所述的自动生成文档样式集的方法的步骤。
CN201911093117.8A 2019-11-11 2019-11-11 一种自动生成文档样式集的方法及装置 Pending CN112784539A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911093117.8A CN112784539A (zh) 2019-11-11 2019-11-11 一种自动生成文档样式集的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911093117.8A CN112784539A (zh) 2019-11-11 2019-11-11 一种自动生成文档样式集的方法及装置

Publications (1)

Publication Number Publication Date
CN112784539A true CN112784539A (zh) 2021-05-11

Family

ID=75749538

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911093117.8A Pending CN112784539A (zh) 2019-11-11 2019-11-11 一种自动生成文档样式集的方法及装置

Country Status (1)

Country Link
CN (1) CN112784539A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822023A (zh) * 2021-09-10 2021-12-21 厦门盈趣科技股份有限公司 一种标准文档自动化生成方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020124019A1 (en) * 2001-01-03 2002-09-05 David Proulx Method and apparatus for rich text document storage on small devices
CN102103605A (zh) * 2009-12-18 2011-06-22 北大方正集团有限公司 一种智能提取文档结构的方法及系统
US20130174017A1 (en) * 2011-12-29 2013-07-04 Chegg, Inc. Document Content Reconstruction
CN108369578A (zh) * 2016-02-01 2018-08-03 微软技术许可有限责任公司 基于先前文档的自动模板生成

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020124019A1 (en) * 2001-01-03 2002-09-05 David Proulx Method and apparatus for rich text document storage on small devices
CN102103605A (zh) * 2009-12-18 2011-06-22 北大方正集团有限公司 一种智能提取文档结构的方法及系统
US20130174017A1 (en) * 2011-12-29 2013-07-04 Chegg, Inc. Document Content Reconstruction
CN108369578A (zh) * 2016-02-01 2018-08-03 微软技术许可有限责任公司 基于先前文档的自动模板生成

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
网友:南博萬: ""java 使用POI操作word获取样式", pages 1, Retrieved from the Internet <URL:https://blog.csdn.net/qq_41129811/article/details/102570726?ops_request_misc=&request_id=&biz_id=102&utm_term=java%E8%AF%BB%E5%8F%96word%E6%96%87%E4%BB%B6%20s%E6%A0%B7%E5%BC%8F&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-0-102570726.142^v96^pc_search_result_base5&spm=1018.2226.3001.4187> *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822023A (zh) * 2021-09-10 2021-12-21 厦门盈趣科技股份有限公司 一种标准文档自动化生成方法及系统
CN113822023B (zh) * 2021-09-10 2023-08-18 厦门盈趣科技股份有限公司 一种标准文档自动化生成方法及系统

Similar Documents

Publication Publication Date Title
US7469380B2 (en) Dynamic document and template previews
CN108647305B (zh) 文档格式转换方法和装置
CN101957730B (zh) 信息处理设备和信息处理方法
US20190147030A1 (en) Systems and methods for providing a communication program interface with an integrated tabular data management interface
KR20060048736A (ko) 전자 문서에서 특정 유형의 컨텐트를 관리하는 방법, 장치및 컴퓨터 판독가능 매체
CN105183475A (zh) 一种用户自定制门户网站个性化页面的方法和系统
JP2009506461A (ja) ユーザ・インターフェース向けマークアップ・ベースの拡張性
WO2019218976A1 (zh) 数据处理方法、装置和计算机可读存储介质
US20190317928A1 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
CN112016290A (zh) 一种文档自动排版方法、装置、设备及存储介质
CN114296662A (zh) 基于网页的表格文书分页打印方法、装置及其应用
CN112784539A (zh) 一种自动生成文档样式集的方法及装置
US20030222916A1 (en) Object-oriented processing of tab text
CN113655968A (zh) 非结构化数据存储方法
CN105988986A (zh) 一种信息处理方法及装置
CN111563065B (zh) 一种文档保存方法、装置及计算机可读存储介质
CN114282499A (zh) 具有定制图表的文档生成方法、装置、电子设备及介质
CN110597576B (zh) 一种文件备注处理方法、系统
CN113986158A (zh) 打印方法、打印设计器及计算机可读存储介质
CN109388507B (zh) 一种快捷转移电子资料的方法和系统
CN113378526A (zh) Pdf段落处理方法、装置、存储介质及设备
US20140075300A1 (en) Recipient based customization card groups
CN101430715A (zh) 一种排版后数据的存储方法和装置
CN112784538A (zh) 一种文档页面编辑方法及装置
CN111831610A (zh) 文件与数据库记录获取方法、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination