CN112668299A - 一种裁判文书自动排版方法及系统 - Google Patents
一种裁判文书自动排版方法及系统 Download PDFInfo
- Publication number
- CN112668299A CN112668299A CN202110100574.6A CN202110100574A CN112668299A CN 112668299 A CN112668299 A CN 112668299A CN 202110100574 A CN202110100574 A CN 202110100574A CN 112668299 A CN112668299 A CN 112668299A
- Authority
- CN
- China
- Prior art keywords
- document
- typesetting
- setting
- typeset
- elements
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明提供一种裁判文书自动排版方法及系统,所述排版方法包括:获取文书模板;对所述文书模板进行解析得到文书规则、文书式样以及文书要素;获取待排版的文书文件文本;对所述待排版的文书文件文本进行解析,得到所述待排版的文书文件文本中的要素以及要素内容;将所述文书模板中的文书要素和所述待排版的文书文件文本中的要素进行匹配;基于所述文书规则和所述文书样式对匹配后的要素进行排版。本发明中的上述方法能够减少人工的残余,提高排版效率。
Description
技术领域
本发明涉及数据处理领域,特别是涉及一种裁判文书自动排版方法及系统。
背景技术
根据最高人民法院发布的《人民法院民事裁判文书制作规范》《民事诉讼文书样式》等文书制作规范可知,法律文书有特殊的格式要求,自动生成的法律文书为了满足格式要求,需要进行自动排版,进而实现法律文书的快速制作。
排版过程是将文本文件转化为文书文件的过程,文本文件是指文本数据,其注重字母符号的内在含义,没有经过编辑排版,而文书文件指带格式的文本文件,一般为国家机关、企事业单位、团体和个人在社会活动中,为了一定的目的而形成并使用的具有特定格式的文字材料,其有较强的规范性,注重文字的表现形式,需要对字符、段落和页面格式进行编辑排版,并且还可以存在图形、表格和图像等元素,例如报告、书信、通知、会议纪要以及电报等都属于文书文件。
目前,法律文书自动排版大多是在文书模板中设置好格式,基本Word模板文件进行后续操作,保留模板中各个文书结构中的格式,从而实现文书格式的规范化。采用该技术可以以在模板中设置格式的方式实现文书的自动排版。
但是,此法不能灵活地实现同一模板不同地域有不同格式要求,且对于新填充的内容的格式不能灵活设置。
再有,现有技术中经常采用的排版软件包括两种类型,一类为批处理排版软件,另一类为交互式排版软件。其中,批处理排版软件也称为“注解式”排版软件,采用该排版软件时,需要在文本数据中加入专用的命令,用以说明版面的排法及要求,该专用的命令包括:文字的字体、字号的大小、标题的位置及版心尺寸等,该中间加入专用命令的文本文件也称为小样文件。运行该批处理排版软件时,需要对小样文件语法检查,并生成用于输出的结果文件或称为大样文件,可以通过计算机屏幕感看模拟的排版结果。采用该批处理排版软件排版效率高,精度高,但是该排版软件不易学习,对排版人员有较高的要求,不适用于版式复杂的文书、图书及刊物等。
另一类为交互式排版软件,可以直接在计算机屏幕上显示文书文件,排版人员通过操纵键盘和鼠标,可以直接在屏幕上修改文字、图形、图像和表格等内容,还可以直观地对内容的表现形式进行调整,每项操作都可以在屏幕上看到对应的结果。交互式排版软件在排版过程中需要较多的人工调整,效率较低,精确度较低。
在排版的过程中可以直接采用排版软件进行排版,也可以采用排版软件与库管理系统相结合的方式进行排版,但是由于排版软件本身存在一些问题,导致排版过程中也存在相应的一些问题。同时由于基于不同的排版软件得到的文书文件的格式不同,使得文书文件在不同的排版软件之间不能直接的相互通用。
发明内容
本发明的目的是提供一种裁判文书自动排版方法及系统,避免过多人工参与,提高了排版效率以及准确率。
为实现上述目的本发明提供了如下技术方案:
一种裁判文书自动排版方法,所述排版方法包括:
获取文书模板;
对所述文书模板进行解析得到文书规则、文书式样以及文书要素;
获取待排版的文书文件文本;
对所述待排版的文书文件文本进行解析,得到所述待排版的文书文件文本中的要素以及要素内容;
将所述文书模板中的文书要素和所述待排版的文书文件文本中的要素进行匹配;
基于所述文书规则和所述文书样式对匹配后的要素进行排版。
可选的,基于所述文书规则和所述文书样式对匹配后的要素进行排版具体包括:
计算当前页面内的可排版区域;
根据待排版要素判断当前页面内的可排版区域是否能够容纳待排版要素;
若是,则对所述可排版区域的当前页面进行页面设置;
若否,则对所述可排版区域的当前页面的下一页进行页面设置;
对进行页面设置后的页面进行段落格式设置。
可选的,在对进行页面设置后的页面进行段落格式设置之后还包括:
对段落格式设置后的页面进行表格格式设置。
可选的,所述页面设置具体包括:
页边距设置、文档网格设置、纸张设置、版式设置以及页脚格设置。
可选的,所述段落格式设置包括:默认格式和自定义格式。
可选的,所述表格格式设置包括:表格行设置和表格单元设置。
可选的,所述文书模板可扩展标记语言XML文件。
可选的,所述解析采用第三方开源技术OpenXML。
本发明另外提供一种裁判文书自动排版系统,所述系统包括:
文书模板获取模块,用于获取文书模板;
第一解析模块,用于对所述文书模板进行解析得到文书规则、文书式样以及文书要素;
待排版的文书文件文本获取模块,用于获取待排版的文书文件文本;
第二解析模块,用于对所述待排版的文书文件文本进行解析,得到所述待排版的文书文件文本中的要素以及要素内容;
匹配模块,用于将所述文书模板中的文书要素和所述待排版的文书文件文本中的要素进行匹配;
排版模块,用于基于所述文书规则和所述文书样式对匹配后的要素进行排版。
本发明另外提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1-8任意一项所述的排版方法。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明中的上述方法通过获取文书模板;对所述文书模板进行解析得到文书规则、文书式样以及文书要素;获取待排版的文书文件文本;对所述待排版的文书文件文本进行解析,得到所述待排版的文书文件文本中的要素以及要素内容;将所述文书模板中的文书要素和所述待排版的文书文件文本中的要素进行匹配;基于所述文书规则和所述文书样式对匹配后的要素进行排版,实现了自动排版,提高了排版效率,避免了过多人工参与,提高了准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一种裁判文书自动排版方法;
图2为本发明实施例一种裁判文书自动排版系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种地址库构建系统以及地址查询方法,能够解决民警采集效率不高、规则不统一、录入工作繁忙等问题。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明实施例一种裁判文书自动排版方法,所述排版方法包括:
步骤101:获取文书模板。
步骤102:对所述文书模板进行解析得到文书规则、文书式样以及文书要素。
步骤103:获取待排版的文书文件文本。
步骤104:对所述待排版的文书文件文本进行解析,得到所述待排版的文书文件文本中的要素以及要素内容。
步骤105:将所述文书模板中的文书要素和所述待排版的文书文件文本中的要素进行匹配。
步骤106:基于所述文书规则和所述文书样式对匹配后的要素进行排版。
具体的,步骤101以及步骤102中,文书模板可以扩展为标记语言(ExtensibleMarkup Language,XML)文件,且,该模板文本包括文书规则、文书式样以及文书要素。该文书规则取决于组织或者机构的文字格式的规范要求,可以有也可以没有。
文书式样主要包括:页面、字体声明、文字、段落、文本框、图形、图像以及单元格和表格等式样。每个式样都具有一个唯一的标识符,即标签,每个段落设置有结构标签或者是段落标签,用一个标识符可以来标识一个式样。并且,在本发明实施例中,采用某个式样应含有属性的方式来定义该种式样,即每个式样包含确定的格式属性,例如:文本框式样描述文书某区域的文字格式,该文本框式样包括:文字、段落、位置、大小、对齐方式、线型及颜色等格式属性。每个式样包含的不同的格式属性也分别对应不同的XML标签,即通过XML标签来标识式样中包含的格式属性。解析文书式样子文件,构建定义的式样。在排版的过程中,可以直接引用式样对应的标识符,同一式样对应的标识符可以多次被引用,排版装置根据式样对应的标识符找到该式样的定义,由该式样的定义对相关要素的格式属性进行格式化。
文书要素式样子文件中的内容包括文书文件的页面信息、显现对象类型(如文字、图形、图像等)、显现对象使用式样和显现对象使用规则等信息,还可包含具体显现对象的内容信息。文书文件一般分为眉首、主体及版记等三个部分,每部分又包含一些文书要素,例如:眉首部分可能包括:秘密等级与保密期限、发文机关、签发人等要素等等。文书包含的要素是可扩展的,可以由组织、机构的文书格式需求来确定。文书要素式样子文件主要是对文书文件中需要包含内容的格式进行描述,通过使用的式样和规则来实现,例如,眉首部分的“秘密等级与保密期限”要使用某一文本框式样,因此,该眉首部分的“秘密等级与保密期限”就引用该文本框式样的唯一标识符,规则使用的方式与式样使用的方式相同。在解析文书要素式样子文件时,由每一要素式样的显现内容对象类型构建显现对象(如文本、图形、图像和表格等显现对象),该要素为显现对象对应的文书要素,要素式样引用的式样标识符就是显现对象采用的式样对应的标识符,要素式样引用的规则标识符就是显现对象采用的规则对应的标识符。
具体的,步骤103和步骤104中,获取待排版的文书文件文本,即用户导入的结构化文件文本,识别该文本文件的内容结构,并根据该文本文件的内容结构,解析获得文本文件中所包含的每个要素及要素内容,其中,文本的结构化信息可以自定义,并且可扩展。
步骤105中,会将解析获得的每个要素与文书显现对象的要素属性进行匹配,将相匹配要素对应的要素内容传给匹配的要素属性对应的显现对象,根据该显现对象使用的文书式样子文件中的式样及文书规则子文件中的规则,对显现对象中的要素内容进行排版。
具体包含以下步骤:
步骤1051:计算当前页面内的可排版区域。
具体而言,计算当前页内可排版区域包括:根据该当前页内已排版的区域,及该当前页的总区域,确定该当前页内可排版区域。
步骤1052:根据待排版要素判断当前页面内的可排版区域是否能够容纳待排版要素。
步骤1053:若是,则对所述可排版区域的当前页面进行页面设置。
步骤1054:若否,则对所述可排版区域的当前页面的下一页进行页面设置。
步骤1055:对进行页面设置后的页面进行段落格式设置。
用户导入的文本文件应是结构化的文本,本发明中通过XML技术来标识文本文件的结构及内容。
步骤105中该当前进行排版的显现对象可以为文本框、表格、图像和图形等。
因此,本发明在对进行页面设置后的页面进行段落格式设置之后还包括:对段落格式设置后的页面进行表格格式设置。
在对表格排版时首先需要对每个表行进行排版,然后对每个表行中的单元格进行排版,在对单元格中的内容进行排版时,其过程与对文本框的排版过程类似。当一个表格在一页内无法排版时,可以将该表格排在两页内,具体的过程包括:计算当前页内可排版区域,根据该当前页内可排版区域的空间,以及该表格排版所用空间,进行判断,当该当前页内可排版区域的空间不小于该表格排版所占空间时,在该当前内的可排版区域内排版该表格,否则,在该当前页的可排版区域内排版该表格,并在该当前页的下一页开始排版的区域,排版该表格的剩余内容。
具体的,所述页面设置具体包括:
页边距设置、文档网格设置、纸张设置、版式设置以及页脚格设置。
所述段落格式设置包括:默认格式和自定义格式。
所述表格格式设置包括:表格行设置和表格单元设置。
所述解析采用第三方开源技术OpenXML。
图2为本发明实施例一种裁判文书自动排版系统结构示意图,如图2所示,所述系统包括:
文书模板获取模块201,用于获取文书模板;
第一解析模块202,用于对所述文书模板进行解析得到文书规则、文书式样以及文书要素;
待排版的文书文件文本获取模块203,用于获取待排版的文书文件文本;
第二解析模块204,用于对所述待排版的文书文件文本进行解析,得到所述待排版的文书文件文本中的要素以及要素内容;
匹配模块205,用于将所述文书模板中的文书要素和所述待排版的文书文件文本中的要素进行匹配;
排版模块,用于基于所述文书规则和所述文书样式对匹配后的要素进行排版。
本发明另外一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,实现上述的排版方法。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种裁判文书自动排版方法,其特征在于,所述排版方法包括:
获取文书模板;
对所述文书模板进行解析得到文书规则、文书式样以及文书要素;
获取待排版的文书文件文本;
对所述待排版的文书文件文本进行解析,得到所述待排版的文书文件文本中的要素以及要素内容;
将所述文书模板中的文书要素和所述待排版的文书文件文本中的要素进行匹配;
基于所述文书规则和所述文书样式对匹配后的要素进行排版。
2.根据权利要求1所述的裁判文书自动排版方法,其特征在于,基于所述文书规则和所述文书样式对匹配后的要素进行排版具体包括:
计算当前页面内的可排版区域;
根据待排版要素判断当前页面内的可排版区域是否能够容纳待排版要素;
若是,则对所述可排版区域的当前页面进行页面设置;
若否,则对所述可排版区域的当前页面的下一页进行页面设置;
对进行页面设置后的页面进行段落格式设置。
3.根据权利要求2所述的裁判文书自动排版方法,其特征在于,在对进行页面设置后的页面进行段落格式设置之后还包括:
对段落格式设置后的页面进行表格格式设置。
4.根据权利要求2所述的裁判文书自动排版方法,其特征在于,所述页面设置具体包括:
页边距设置、文档网格设置、纸张设置、版式设置以及页脚格设置。
5.根据权利要求2所述的裁判文书自动排版方法,其特征在于,所述段落格式设置包括:默认格式和自定义格式。
6.根据权利要求3所述的裁判文书自动排版方法,其特征在于,所述表格格式设置包括:表格行设置和表格单元设置。
7.根据权利要求1所述的裁判文书自动排版方法,其特征在于,所述文书模板可扩展标记语言XML文件。
8.根据权利要求1所述的裁判文书自动排版方法,其特征在于,所述解析采用第三方开源技术OpenXML。
9.一种裁判文书自动排版系统,其特征在于,所述系统包括:
文书模板获取模块,用于获取文书模板;
第一解析模块,用于对所述文书模板进行解析得到文书规则、文书式样以及文书要素;
待排版的文书文件文本获取模块,用于获取待排版的文书文件文本;
第二解析模块,用于对所述待排版的文书文件文本进行解析,得到所述待排版的文书文件文本中的要素以及要素内容;
匹配模块,用于将所述文书模板中的文书要素和所述待排版的文书文件文本中的要素进行匹配;
排版模块,用于基于所述文书规则和所述文书样式对匹配后的要素进行排版。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1-8任意一项所述的排版方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110100574.6A CN112668299A (zh) | 2021-01-26 | 2021-01-26 | 一种裁判文书自动排版方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110100574.6A CN112668299A (zh) | 2021-01-26 | 2021-01-26 | 一种裁判文书自动排版方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112668299A true CN112668299A (zh) | 2021-04-16 |
Family
ID=75414480
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110100574.6A Withdrawn CN112668299A (zh) | 2021-01-26 | 2021-01-26 | 一种裁判文书自动排版方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112668299A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114048712A (zh) * | 2021-10-29 | 2022-02-15 | 珠海金山办公软件有限公司 | 一种公文的生成方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101872340A (zh) * | 2009-04-23 | 2010-10-27 | 北京大学 | 一种基于版面格式模板的排版方法及装置 |
CN101989256A (zh) * | 2009-07-31 | 2011-03-23 | 北京大学 | 一种文书文件的排版方法及装置 |
CN110489728A (zh) * | 2019-08-20 | 2019-11-22 | 北京市律典通科技有限公司 | 法律文书自动排版方法及装置 |
-
2021
- 2021-01-26 CN CN202110100574.6A patent/CN112668299A/zh not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101872340A (zh) * | 2009-04-23 | 2010-10-27 | 北京大学 | 一种基于版面格式模板的排版方法及装置 |
CN101989256A (zh) * | 2009-07-31 | 2011-03-23 | 北京大学 | 一种文书文件的排版方法及装置 |
CN110489728A (zh) * | 2019-08-20 | 2019-11-22 | 北京市律典通科技有限公司 | 法律文书自动排版方法及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114048712A (zh) * | 2021-10-29 | 2022-02-15 | 珠海金山办公软件有限公司 | 一种公文的生成方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2358311C2 (ru) | Документ текстовой обработки, хранящийся в едином файле xml, которым могут манипулировать приложения, понимающие язык xml | |
CN101470698B (zh) | 一种发文机关标识的排版方法及相应系统 | |
US20070038927A1 (en) | Electronic document conversion | |
CN109857670B (zh) | 一种基于通用模板的测试报告自动生成方法 | |
CN108415887A (zh) | 一种pdf文件向ofd文件转化的方法 | |
CN108681530A (zh) | 一种基于Web的公文生成方法及系统 | |
US20050193334A1 (en) | Layout system, layout apparatus, layout program, template selection program, storage medium having stored therein layout program, and storage medium having stored therein template selection program, as well as layout method | |
CN104239284A (zh) | 一种图文自动排版的方法和装置 | |
CN106469140A (zh) | 一种报表生成系统及其方法 | |
US8386943B2 (en) | Method for query based on layout information | |
CN111309313A (zh) | 一种快速生成html以及存储表单数据的方法 | |
CN104298725A (zh) | 在线课件开发系统一次性编辑输入多版本输出的方法 | |
KR102119560B1 (ko) | Svg 포맷을 이용한 폰트 편집 방법, 시스템 및 컴퓨터 판독 가능한 기록매체 | |
CN111597771A (zh) | 一种调整文档内容格式的方法、装置、电子设备及介质 | |
US7366978B1 (en) | Method and system for creating a grid-like coordinate system for addressing data contained in an irregular computer-generated table | |
CN113378585B (zh) | Xml文本数据翻译方法和装置、电子设备、存储介质 | |
CN112668299A (zh) | 一种裁判文书自动排版方法及系统 | |
JP4566196B2 (ja) | 文書処理方法および装置 | |
CN111126007B (zh) | 一种基于html病历文书分页算法 | |
CN112433995A (zh) | 文件格式转换方法、系统、计算机设备及存储介质 | |
CN108228688B (zh) | 一种基于xbrl的模板生成方法、系统及服务器 | |
KR20040090867A (ko) | 그레비티 레이어 방식을 이용한 xsl 스타일 시트의자동 생성 방법 | |
US9946698B2 (en) | Inserting text and graphics using hand markup | |
US11416671B2 (en) | Device dependent rendering of PDF content | |
CN110457659B (zh) | 条款文档生成方法及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210416 |